Giriş
Şu anda, yeterli kaynağa sahip diller ile daha az kaynağa sahip diller arasında gittikçe büyüyen bir dijital uçurum var. Bu uçurum, az kaynaklı diller için dijital yok olma tehlikesini daha da artırıyor. Çoğunluk dilleri için, web’de büyük oranda var olmaları nedeniyle, faydalı araçlar ve kaynaklar oluşturma süreci çok daha kolay. Ancak, birçok azınlık dili, bu tür araçların yaratılmasını sağlamak için yeterli maddi ve insan kaynağına sahip değil. Devlet desteğinin olmaması, kamusal görünürlük, toplumsal ve kurumsal baskı, bu dillere günümüzün dijital alanlarında öncelik verilmemesinin doğrudan nedenleridir.
Dillerin korunmasına yönelik çabalar, esas olarak dil dokümantasyonu, öğretimi ve fiziksel topluluk oluşturmaya odaklanır. Göz ardı edilen bir alan ise yapay zekaya dayalı araçların oluşturulmasıdır. Makine çevirisi, konuşma sentezi ve konuşma tanıma gibi araçlar, artık insan-makine arayüzleri oluşturmada önemli eşdeğerlerdir. Ayrıca bu araçlar, ölmekte olan dillerin dil birikimini modellemeye ve bu dilleri gelecek nesiller için korumaya yardımcı olabilir.
Bu belge kimler için hazırlandı?
Bu belge:
Kendi dillerindeki araçları ve kaynakları genişletmekle ilgilenen dil aktivistleri
Araştırma ve dil teknolojilerinin yaratılması için veri toplamakla ilgilenen dilbilimciler
Çalıştıkları dil için verileri artırmakla ilgilenen doğal dil işleme (NLP) araştırmacıları
Kaynakları yetersiz yerel ve küresel dillerin yeniden canlandırılmasına katkıda bulunmak isteyen dil aktivisti destekçileri için hazırlanmıştır.
Katkıda bulunabilir miyim?
Bu belge, açık lisanslı (CC-BY) yaşayan bir belgedir. Kaynak dosyası https://github.com/CollectivaT-dev/language-toolkit adresinde herkese açık olarak paylaşılır. Buradan kendiniz çalışmak için bir sürüm çekebilir ve ardından katkınızı gönderebilirsiniz. Bunlar, yazım hatalarını düzeltmek, çeviri eklemek, bir bölümü detaylandırmak ve kendi çalışmanızı açıklamak gibi katkılar olabilir. Tereddütlerinizi info@collectivat.cat adresinden bize iletebilirsiniz.