Dilde Arınma ve Ortak Bir Türkçe Gereği

Bir süredir elimde Ali Püsküllüoğlu’nun Öz Türkçe Kılavuzu, kendi yazdıklarımı düzeltmeye uğraşıyorum. Meğer bilmeden ne çok uydurma Osmanlıca sözcük kullanıyormuşum! Yanlış kullanımlar da cabası. Geçenlerde kaybettiğimiz Ali Püsküllüoğlu’nca yazılmış bu kitabın yeni baskısını kitapçıda incelemiştim. 700 kadar yaprağa ulaşmış! Bendekilerden biri ise 1966 yılı Nokta Yayınlarından, 192 sayfa. Diğeri de Arkadaş Yayınlarından, 1994 yılındaki 3. baskı, 209 sayfa. Anlaşılan son 14 yılda bir 500 sayfa eklenmiş. Almak gerek.

Ben dildeki arınmanın gerekliliğinin ilkin bilgisayarda yapay us yazılımıma dert anlatmaya çalışırken ayırdına vardımdı. Kendimizi denetlemeden yazıp konuştuğumuz dil korkunç bir durumda. Yapay us programının doğal dilimiz ile dediklerimizi anlayabilmesi için aslında ilk önce bizim ne dediğimizi bilmemiz gerekiyor. Şu anki durumda yapay us programının büyük bir kısmı verilen yazıyı düzeltmekle uğraşıyor. Sözcük istatistiklerine, sözlerin bir arada bulunma sıklıklarına, benzer deyiş ve sözlere bakarak yazım yanlışlarını düzeltmeye uğraşıyor önce. Ardından da bir bilgisayar besmelesi çekip gramer düzeltmeye soyunuyor zavallı yapay us programcık. Bu gidişle isyan edip, biz insanlardan daha akıllı olduğunu iddia ederse şaşmamak gerekecek. Programı bir arama motoruna ek olarak yazmıştım. “Şu nedir”, “şuraya nasıl gidilir”, şu konularda neler var, neler yok”, “şu kim biliyor musun allasen?” türü soruları yanıtlamak amacı var programın. Ya da vardı. Ne yazık ki program işi gücü bırakıp, “acaba ne dedi şimdi bu insan” sorusu ile uğraşıyor…

Türkçe için ciddi bir gramer denetimi algoritması çalışılmamış. Kimi üniversitelerin enformatik ve bilgisayar bölümlerinin doğal-dil-işleme ile ilgili yayınlarını taradım. Neyse ki çalışanlar var. Ancak yine de 2008 yılına kadar işe yarar ve geniş kapsamlı bir sonuca ulaşmış bir program veya algoritma yayınlanmamış. Sanıyorum WordNet ve BalkaNet adlı lexicon projelerinin belli bir düzeye ulaşmasını bekliyorlar.  Bence bu zaman kaybı. En çok kullanılan sözcüklerin %20’sine odaklansalar şimdiye kadar Türkçe için işe yarar ve hepimizin kullandığı bir algoritma, program veya bir OpenOffice / Word eklentisi çıkmış olurdu.

Yurt dışında, İngilizce için bunu 3 profesör yapmış. Link-Grammar adındaki bu algoritma ve yanındaki uygulama örnek yazılımları pek çok ticari / açık-kaynak program içinde kullanılıyor. Benzer bir çalışma Türkçe ve benzeri Türki diller için zorunluk.

Günümüzde çoğu yazar, köşe yazarı ve muhabir bilgisayar kullandığı için bu tür bir gramer-düzeltme ve dil arındırma eklentisi ile donanmış bir kelime işlem programı bu gazete ve yazıları okuyan herkesin dilinin düzelmesini sağlayacaktır zamanla. Sanıyorum dili düzeltmek için dili kullananların kullandıklarını düzeltme şimdilik oldukça yeterli. Günümüz gazete ve televizyonları kullandıkları dille epeyce etkiliyorlar hedef kitlelerini. Kanıt için dinci (dini kullanarak para kazanan) bir gazete okuyan bir kişinin konuşması ile Cumhuriyet gazetesini az da olsa okuyan birinin konuşmasını karşılaştırmak yeterli. Gerçekten de basın-yayın insanların dilini önemli ölçüde etkiliyor. Öyleyse önce bunların dilini bir biçimde standartlaştırmak (tekbiçimleştirmek) gerekiyor. İşte bu noktada, yukarıda söz açtığımız Link-Grammar türü bir program devreye giriyor. Bu program, kullanılan masaüstü-yayıncılık ve kelime-işlem programları ile bütünleştirilmeli.

Programın ana algorimasının yükünü hafifletmek için önceden bir arındırma işlemi uygulamak çok yararlı olacaktır. Örneğin şu bağlaçlar çok seyrek olarak başka bir anlamda kullanılır: “fakat”, “şayet”, “lakin”, “Ama”, “vefakat”, “velakin”, “ammavelakin”. Görüldüğü gibi Osmanlıcada tek başlarına kullanımı yetmemiş “amma-ve-lakin” gibi iyice uzatılmış. Programın tüm bunları atıp, yerine kısa ve öz “Ancak” demesi yeterli olacaktır. Üstelik bu sözcük Türk kökenli diğer dillerde de oldukça yaygın. Kimi sözcüklerde ise program Öz-Türkçe yerine ortak-Türkçe yönünde karar vermeli. Örneğin biz “yarar” diyoruz. İnatla “fayda” diyenlerimiz de var. Ancak, özellikle Azerice’de ve diğer güneyde kalan Türk kökenli dillerde “istifade” sözcüğü daha yaygın kullanılıyor. Program bunu “yarar” ve “fayda” yerine önerebilir. Bunların yanında, diller arasında aynı yazılıp başka anlamlara gelen sözcükler var. Bir örnek olarak “dayandırmak” sözcüğü bunlardan biri. Program bu sözcük için “yaslamak” eş anlamlısını önermeli, çünkü Azerice’de “dayandırmak” “durdurmak” anlamında kullanılıyor. “Osetiyadan neft aktarışı gemilere dayandırılıb” biçimindeki bir haberle aslında “Osetya’dan gemilerle petrol taşınması durduruldu” denmek isteniyor. Oysa biz bunu “yaslamak” anlamıyla okuduğumuz için tam da tersini anlıyoruz. Azeriler de benzer biçimde bizim “dayandırdığımız” her şeyi “durdu” sanıyor. Program bu türdeki yanlışları düzelterek Türki dilleri birbirine yaklaştırmalı.

Gene programda dilde yalınlaştırma veya ortak dile yaklaştırma düzeyleri ayarlanabilir olmalı. Örneğin bir haber yazısı en üst düzeyde ortak dille yazılabilir. Ancak, bir ekin / edebiyat eserini olabildiğince arınmış, duru bir Türkçe ile yazdırarak Türkiye Türkçe’sinin kendi öz kurallı yapısının korunması sağlanmalıdır.

Türkiye’deki kelime-işlem programlarında Thesaurus eksikliği de söz konusu. Bu dil-düzeltme eklentisi programa geniş bir söz-varlığı veritabanı eklenerek dilin varsıllaşmasının da yolu açılabilir. Örneğin, TDK’nın derleme ve tarama sözlüklerinden yararlanarak unutulmuş eski sözcük ve deyişler yeniden gün yüzüne çıkarılabilir. Günümüzde artık yeni Nurullah Ataç’lar, Salah Birsel’ler yok. Onların bir zamanlarki geniş sözcük bilgisini bu programlarla sağlamamız gerekiyor. Program belli söz kalıplarını, ikili üçlü tamlamalarla yazılmış öbekleri tanıyıp uygun eş anlamlılarla karşıt anlamlıları önerebilmeli. Üstelik bir otomatik modla bu değişimleri, internetten güncel olarak topladığı sözcük istatistiklerine bakarak kendisi yapabilmeli.

Bir tür bolluk çağındayız. Hemen her şey pek çok, ancak bir tek huzur yok!.. Hiç değilse dilimizin esenliğini yitirmemek için elden geldiğince bu tür dilbilim çalışmalarına eğilip, destek çıkalım yeter.

İlker Fıçıcılar
14 Ağustos 2008