Project KAIRA is more than an AI initiative; it is a cultural manifesto. In a world dominated by generic, English-centric models, we are building Turkey's most significant open-source Large Language Model ecosystem.
Our goal is simple yet ambitious: to construct a bridge between our linguistic heritage and the future of artificial intelligence. By curating a massive 150B+ token dataset, we ensure that the Turkish language is not just represented, but mastered by the machines of tomorrow.
Project KAIRA sadece bir yapay zeka girişimi değil, kültürel bir manifestodur. İngilizce odaklı modellerin domine ettiği bir dünyada, Türkiye'nin en önemli açık kaynaklı Dil Modeli ekosistemini inşa ediyoruz.
Hedefimiz basit ama iddialı: Dilsel mirasımız ile yapay zekanın geleceği arasında bir köprü kurmak. 150 Milyar tokenlık devasa bir veri seti ile, Türkçenin yarının makineleri tarafından sadece temsil edilmesini değil, ustalıkla kullanılmasını sağlıyoruz.
Our founder, Umut Kökgöz, approaches AI with the discipline of a Chef. To us, data is the ingredient, and model architecture is the recipe. Just as a chef respects the source of their produce, we respect the integrity of our data sources.
"Project KAIRA utilizes high-end architectures like VITS for speech synthesis and custom pre-training pipelines for Large Language Models, aiming to process over 150 Billion Turkish tokens."
Our "Kitchen" is equipped with industrial-grade tools:
Kurucumuz Umut Kökgöz, yapay zekaya bir Şef disipliniyle yaklaşıyor. Bizim için veri malzeme, model mimarisi ise tariftir. Bir şefin malzemesine duyduğu saygıyı, biz de veri kaynaklarımıza duyuyoruz.
"Project KAIRA, konuşma sentezi için VITS gibi üst düzey mimarileri ve Büyük Dil Modelleri için özel ön eğitim hatlarını kullanarak 150 Milyardan fazla Türkçe token işlemeyi hedeflemektedir."
"Mutfağımız" endüstriyel standartlarda araçlarla donatılmıştır:
Founder & Lead AI Researcher | Project KAIRA | Specialized in Turkish LLMs & TTS Architectures Kurucu & Yapay Zeka Araştırma Başkanı | Proje KAIRA | Türk LLM'lerini ve TTS Mimarilerini Spesifikasyonu
Independent AI researcher and developer with a unique background as a professional chef. He treats data with the precision of a culinary artist, specializing in large-scale data cleaning, LLM pre-training, and neural-symbolic AI. Profesyonel aşçılık geçmişine sahip bağımsız yapay zeka araştırmacısı. Veriye bir mutfak sanatçısının hassasiyetiyle yaklaşır; büyük ölçekli veri temizleme, LLM ön eğitimi ve nöral-sembolik yapay zeka konularında uzmanlaşmıştır.
LinkedIn
Lead Software Engineer & Data Scientist Baş Yazılım Mühendisi & Veri Bilimci
Computer Engineer certified by IBM and Miuul, specializing in building robust data pipelines and optimizing workflows with TensorFlow and PyTorch. Leads technical architecture and scalability at Project KAIRA. IBM ve Miuul sertifikalı Bilgisayar Mühendisi. TensorFlow ve PyTorch ile sağlam veri hatları kurma ve iş akışlarını optimize etme konusunda uzmandır. Project KAIRA'da teknik mimariye ve ölçeklenebilirliğe liderlik eder.
LinkedIn