Günceleme: Hemen Çevir sitesinin scriptinin nasıl çalıştığına ve Pro Çeviri programını nasıl kullandığına ilişkin bilgiyi yazının sonundaki notlarda bulabilirsiniz. Alternatiflerine ise dil bağlantıları sayfasından bakabilirsiniz.
Makine çevirisi gerçekten bir gereksinim. Ancak, bilmediğimiz bir dildeki yazı hakkında fikir edinmede kullanılabilirler henüz. Bu yazıyı 2008 yılı ortasında yazıyorum ve hala doyurucu bir makine çevirisi programı yok. Türkçeden İngilizceye çeviri ise yeni açılan bir site tarafından yeni sunulmaya başlandı.
Aşağıda HemenÇevir.com ile Pro Çeviri 2008 v2.0′ın demo sürümüne ilişkin karşılaştırmalar yer alıyor. Sonra da Hemen Çevir sitesi Pro Çeviri v1.9 programını nasıl korsan kullanıyor o anlatılıyor. Karşılaştırmalarda kullandığım cümleler theregister.co.uk ve bbc.co.uk adresinden alıntı. “Acaba haber çevirmede ne kadar başarılılar” diyerek yaptığım bir denemenin sonucu bunlar:
Karşılaştırmada önce İngilizce cümle, sonra hemençevir.com çevirisi, sonra da Pro Çeviri 2008 çevirisi sıralanıyor. Birkaç örnekten sonra da cümle yapısı ile oynayarak sonucu iyileştirme denemeleri yaptım. Bulguları ise bu örnek ve denemelerin ardından veriyorum:
Bilgisayar Çevirisi Örnekleri:
İngilizcesi: We have been using full blown Debian desktop computers for many years now.
Hemenceviri: Biz, şimdi birçok yıl boyunca kullanan dolu uçurulan Debian masaüstü bilgisayarları olduk.
ProÇeviri otomatik: Biz, şimdi birçok yıl boyunca kullanan dolu üflenen Debian masaüstü bilgisayarları olduk.
ProÇeviri etkileşimli: Biz, şimdi birçok yıl boyunca dolu üflenen Debian masaüstü bilgisayarlarını kullanmaktayız.
Yorum: Ne kadar ilginç değil mi? HemenÇeviri ve Pro Çeviri’nin otomatik modu aynı sonucu verdi! Bunun olasılığı nedir acaba?
Bir başka cümle deneyelim:
İngilizcesi: For the last two years, all his gas bills have been estimated.
Hemenceviri: Son iki yıl boyunca, onun bütün gaz faturaları, tahmin edildi.
Proçeviri otomatik: En son iki yıl boyunca, onun bütün gaz faturaları, tahmin edildi.
Yorum: Daha neler! Bir tek ‘En’ sözcüğü farkı var! Sanırsınız ki ProÇeviri ile Hemençevir aynı çeviri motorunun farklı sürümlerini kulanıyor. Devam edelim ve daha farklı yapıda bir cümle deneyelim. Gerçi demo sürüm p r s harfleri ile başlayan sözcüklere sahip çevirileri reddettiğinden uygun cümle bulmak zor oluyor:
İngilizcesi: He went over the fields and they fought with their fists.
Hemencevir: O, alanlara gitti, ve onlar, onların yumruklarıyla kavga etti.
Proçeviri: O, alanlara gitti ve onlar, onların yumruklarıyla savaştı.
Yorum: Bir virgül bir de ‘fought’ sözcüğü için farklı bir karşılık kullanımı var sadece. Her iki makine çevirisi de aynı yapısal hatayı tekrarlıyor. Öğretmenler de öğrencilerin kopya çektiklerini aynı yanlış yanıtlardan anlamazlar mı zaten. Bu arada cümlenin doğru çevirisi “Cephelere gidip yumruklarıyla savaştı.” veya benzeri olmalıydı.
İngilizcesi: We’re a family we have bills to disburse and every cent counts at the moment.
Hemenceviri: Biz, bizim, ödemesi için faturalar olduğu ve her sentin, şu anda saydığı bir aileyiz.
ProÇeviri otomatik: Biz, bizim, ödemek için faturalara sahip olduğumuz ve her sentin, şu anda saydığı bir aileyiz.
ProÇeviri etkileşimli: Biz, bizim, ödemek için faturalara sahip olduğumuz ve her sentin, şu anda sayıldığı bir aileyiz.
Yorum: İngilizce cümlede pay penny ve so sözcükleri vardı. ProÇeviri demo sürümüne uysun diye bunları disburse cent ve and sözcükleriyle değiştirdim. Etkileşimli modda ’sayıldığı’ değişimi ile çeviri daha anlamlı oldu. Yalnız yine de çeviri sonucundaki yapısal benzerlik bize ProÇeviri ile HemenÇevir’in aynı programın farklı sözlüklü ya da sürümlü halleri olduğunu söylüyor.
Bu benzerliği açıklayabilecek birkaç olasılık var: Ya HemenÇevir.com sitesi ProÇeviri’nin programcısı Mehmet Cem Özmen tarafından yazıldı, ya ProÇeviri’nin kaynak kodu bir biçimde dışarı sızdı ve HemenÇevir’in sahibi tarafından asp arayüzü ile kullanılacak şekilde değiştirildi, ya da HemenCevir.com sahibi tarafından Visual Basic’te vs. bir ara geçit programı yazılarak ProÇeviri’nin klavye girdisi veya seçili metnin ctrl-D ile proçeviriye aktarılıp proçevirinin çıktısı bu ara programla yakalanmış olabilir. Hemençevir’in tam online değil de offline çalışması da bunu doğrular nitelikte aslında. Hemençevir’e verdiğiniz çeviriler .asp arayüz tarafından bilgisayarda çalışan ‘bir başka programa’ veriliyor. Daha sonra arayüz ‘tahmini’ bir süre kadar bekliyor ve ‘o başka programın’ bir metin dosyasına yazdığı sonucu okuyup web sayfasından bize sunuyor. Bunu çeviri sonuç sayfa adresinden de anlıyoruz; adresin sonu şu şekilde oluyor genelde: ‘…&dosya=807120123n.txt’.
Bu arada ProÇeviri’nin yazarı Mehmet Cem Özmen iken, HemenÇevir.com ile HemenSozluk.com’u hazırlayan Tayfun Yalazkan (domain sorgusu ve arama motorlarındaki çapraz denk referanslara göre).
Bu duruma, yani hemencevir’in aslında arka planda Pro Çeviri’yi kullanan basit bir .asp geçidi olduğuna ilişkin son testimizi de yapalım. Sadece Pro Çeviri’nin kullandığı bir özellik var. Eğer bu da hemencevir’de aynı şekilde geçiyorsa, ki hemencevir.com’un hiç bir yerinde bu özellikten bahsedilmiyor, kuşkumuz kesinlikle kanıtlanmış olacak: Bu özellik ‘özel isim belirteci’, yani Pro Çeviri’nin yardım dosyalarında da belirtilen ‘#’ işareti kullanımı. Özel isimlerden önce bunu kullanırsak Pro Çeviri o adı çevirmeye çalışmıyor. Mesela April bir kişi adı olabilir, ya da ‘aunt May’ yanlışlıkla ‘mayıs hala’ diye çevrilmesin istiyoruz. Bu durumda çeviriyi ‘aunt #May’ şeklinde yazarız. Örnek bir tümceyi Pro Çeviri ve hemencevir.com’da deneyelim:
İngilizcesi: Apple had offered me a job, but they were too bureaucratic.
Pro Çeviri #’siz: Elma, bana bir işi teklif etmişti, ama onlar, fazla bürokratikti.
Hemencevir #’siz: Elma, bana bir işi teklif etmişti, ama onlar, fazla bürokratikti.
#’li hali: #Apple had offered me a job, but they were too bureaucratic.
hemencevir #’li: Apple, bana bir işi teklif etmişti, ama onlar, fazla bürokratikti.
Pro çeviri’nin #’lisi de aynı. Sanıyorum daha fazla araştırmaya gerek kalmadı…
Özetle, HemenÇevir.com sitesi ProÇeviri programının eski ve kullanıcı sözlüğü hafifçe değiştirilmiş bir sürümünü kullanıyor.
Bu yazıya makine çevirisi optimizasyonu için kontrollü karşılaştırma yapmak için başlamıştım. Örneklerdeki aşırı benzerliği fark edip araştırınca yazı yarım kaldı. Bu hukuki sorunu ilgililere bırakıp, bu yazının başlığını “HemenÇeviri ile ProÇeviri Karşılaştırması” diye değiştirip, bilgisayar çevirisi araştırmamıza “Bilgisayar Çevirisi İyileştirmeleri” başlıklı yeni bir yazıda, Pro Çeviri 2008 ile devam edelim. Demo sürümünde p r s harfleriyle başlayan sözcükler kullanılmadığından bu programa ihtiyaç duyanlar 20 gün sigara içmeyip sigara parasıyla bu programı satın alabilirler. Para havaya gideceğine iş yapan bir programcıya gitmiş olur böylece.
İlker Fıçıcılar
12 Temmuz 2008
Not: Bu yazıyı yazdıktan 10 gün sonra HemenÇevir.com’da yeni denemeler yaparken farkettim ki # karakterini artık hemençevir siliyor! HemenÇevir’in arka planda Pro-Çeviriyi kullandığını sadece # işaretine bakarak söylemiyoruz ki… Yukarıda diğer kanıtlar da var. Eğer # karakteri hemençevir’e geri konulursa daha iyi olur. Hemen-çevir orijinal bir program olmasa da bunu saklamaya gerek yok. O kare işareti daha doğru çeviri yaptırabilmeye yarıyordu sonuçta…
Not2: (14.08.2008) Birkaç gün önce Hemen Çevir‘in forumunda “Hemen Çevir = Pro Çeviri 1.9” diye bir tartışma vardı. Tartışmada şu an okuduğunuz bu yazıya da gönderme yapılmış, gayet de güzel örneklerle biraz matematikten, istatistikten anlayan herkesin görebileceği gibi “Hemen Çevir” sitesinin arka planda Pro Çeviri’inin lisanslı 1.9 sürümünü, Pro-Çevir’in telif haklarını çiğneyerek kullandığı kanıtlanmıştı. www.HemenÇevir.com sitesini açan Sn. Tayfun Yalazkan belki farkında değil, ancak bu suçunun 200 milyar ve 6 yıla kadar hapis gibi ciddi cezaları var. Neyse. Bu ikinci notu düşme sebebim, forumda o gerçeği gören çocuğun ve hemen çevir’in çakma pro-çeviri olduğunu söyleyen diğer yazıların apar topar yok edilmesi. “Neler oluyor?” diye soran bir başka yazı daha vardı, birkaç saate kalmadan o da gitmiş. Neyse ki bu konuşmaları arama motorlarından hala bulmak mümkün: http://www.google.com.tr/search?hl=tr&q=pro%C3%A7eviri+site%3Amaruzat.com Bu arama sonuçlarının altındaki önbellek bağlantısına tıklayarak ayrıntıları okuyabilirsiniz.
Not 2′ye ek: Hemen-Çevir sitesi şöyle çalışıyor: 1. Verilen metin bir .ASP scriptince panoya (clipboard) kopyalanır. 2. Script CTRL-D çağrısını windows’a gönderir (Lisanslı Pro-Çeviri programı CTRL-D ile aktifleşip panodaki yazıyı çevirmeye başlama özelliğine sahip). 3. ASP script (Hemen Çevir’in default.asp’si) yazının uzunluğuna göre tahmini bir süre bekler ve CTRL-S tuş kombinasyonunu windows’a gönderir (Gene Pro-Çeviri’nin bir özelliği: CTRL-S’yi görünce çeviriyi önceden belirtilmiş bir dosyaya kaydeder). 4. default.asp scripti o sabit dosya adındaki çeviriyi başka bir dosya adına kopyalar (işte bu aşamada eğer bekleme süresini yanlış tahmin ettiyse bir önceki çeviriyi kopyalıyor bilmeden, sizinki henüz hazır olmadığı için. Arada bir Hemen Çevir’de başkasının çevirisini görmeniz bu yüzden). 5. Bekleme sonunda default.asp o yeni dosya adını ve verilen orijinal metni GET method’u ile gene kendisine vererek kendisini çağırıyor. 6. default.asp dosya adlı değişken verilmiş mi diye bakıp, o dosyanın içeriğini ve kendi kendisine yeniden verilmiş metni size gösteriyor. Kısaca, Hemen Çevir dediğimiz site belki 10KB’ı bile geçmeyen basit bir ASP scriptinden ibaret. Ve Pro-Çeviri gibi, SameTran gibi, BilSag gibi, Simka gibi bu çeviri programlarını üreten ve emeklerinin karşılığını kazanmaya çalışan gerçek programların yazarlarının zarar etmesine yol açıyor. Pro-Çeviri‘nin sahibi tazminat davası açsa sanırım 2-3 yıllık satış miktarı kadar bir maddi ve marka-zararı sebebi ile de bir miktar manevi tazminat alabilir Sn. Tayfun Yalazkan’dan.
Not 2′nin ekine ek: Tartışmalarda Pro-Çeviri’nin kırık (warez, hack edilmiş) sürümünün hiç de iddia edildiği gibi Hemen-Çevir ile aynı sonucu vermediği söyleniyordu. Doğrudur. Pro-Çeviri kopya koruma yolu olarak p, r ve s harfleri ile başlayan sözcükleri çevirmiyor. Bu sözcükler hem program içinde engelli, hem de demo sürümünün veritabanından çıkarılmışlar. Kısaca Pro-Çeviriyi kıran kişi anlaşıldığı kadarıyla sadece bir Hex-Editor’u ile ana program’da p, r, s kontrolü yapılan yerdeki bu harfleri az kullanılan bir başka karakterle, ‘ğ’ ile mesela değiştirmiş. Sonra da daha eski bir sürümden veri tabanını kopyalamış olabilir. ProÇeviri’nin bu veritabanı dosyalarının adı dict.DAT ve dict.IDX. Bu dosyaları başka versiyonlarınki ile değiştirerek siz de çevirilerin farklılaştığını görebilirsiniz. Çünkü bazı sözcükler kimi veritabanında sıfat olarak, kimilerinde ise fiil olarak işaretlenmiş. Anlaşılan Pro Çeviri’nin yazarı Mehmet Cem Özmen bey, bu çeviri sözlüğünü eldeki verilere göre yeniden düzenleyerek yeni sürümlerde çeviri kalitesini iyileştiriyor. Bir Hex editörü ile siz de bu dosyaları inceleyerek ProÇeviri’nin hangi sözcükleri tanıdığını görebilirsiniz… Bir ek not daha: Kimi zaman hemencevir’in sunucu bilgisayarlarından biri (4 tane var görünüyor şimdilik 80-83. portlardan hizmet veriyorlar) uzun süre kapalı kalıyor. Bir sunucu için normal olmayan bu durumun sebebi ise düzeneği yalnızca elle yeniden başlatabilme durumu. Öyle ya, bilgisayar açıldıktan sonra Pro Çeviri’yi de açmak ve ilk çeviriyi yaptırıp çeviri sonucunu “belli bir dosya adı ile” kaydetmek gerek. İlk kayıt yapılmadan Pro-Çeviri hangi dosyaya kayıt yapacağını bilemediğinden her zamanki dosya kayıt penceresi açılıyordur, hemençeviri’nin default.asp scripti CTRL-S çağrısı yolladıkça Windows’a…
Evet… Özetle Hemen Çevir, Pro-Çeviri’nin haklarını, telifini ve yazarının emeklerini gasp ediyor. Eğer, Türkiye’deki yazılım sektörünün gelişmesini istiyorsak işimize yaradığını gördüğümüz programları satın almalıyız. Üstelik basit bir hesap yapınca, hiç de pahalı değiller.
Bir öğrenci bile olsanız boşa harcadığınız paraları bir düşünün… Emeğin bir bedeli var, ve bu bedeli öderseniz aldığınız ürünlerle hizmetler giderek daha da gelişecektir.
Bu devirde dışarıya fındık fıstık satarak kalkınamayacağımızı fark edenlerdenseniz, yerli yazılım üreticilerinin programlarını ücreti karşılığı kullanarak ilerleme ve gelişmeye destek olabilirsiniz.