<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>DİL ÜZERİNE</title>
	<atom:link href="http://diluzerine.wordpress.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://diluzerine.wordpress.com</link>
	<description>Dil üzerine deneysel çalışmalar ve bilgiler</description>
	<lastBuildDate>Wed, 07 Dec 2011 14:24:34 +0000</lastBuildDate>
	<language>tr</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.com/</generator>
<cloud domain='diluzerine.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://s2.wp.com/i/buttonw-com.png</url>
		<title>DİL ÜZERİNE</title>
		<link>http://diluzerine.wordpress.com</link>
	</image>
	<atom:link rel="search" type="application/opensearchdescription+xml" href="http://diluzerine.wordpress.com/osd.xml" title="DİL ÜZERİNE" />
	<atom:link rel='hub' href='http://diluzerine.wordpress.com/?pushpress=hub'/>
		<item>
		<title>EC Tercüme ve Şip Şak Çeviri Sitesi</title>
		<link>http://diluzerine.wordpress.com/2011/12/07/ec-tercume-ve-sip-sak-ceviri-sitesi/</link>
		<comments>http://diluzerine.wordpress.com/2011/12/07/ec-tercume-ve-sip-sak-ceviri-sitesi/#comments</comments>
		<pubDate>Wed, 07 Dec 2011 14:06:32 +0000</pubDate>
		<dc:creator>aramarehberi</dc:creator>
				<category><![CDATA[Anlambilim]]></category>
		<category><![CDATA[anlambilim]]></category>
		<category><![CDATA[çeviri]]></category>
		<category><![CDATA[yapay zeka]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=123</guid>
		<description><![CDATA[EC Tercüme Bürosu&#8217;nun Şip Şak Çeviri diye bir sitesi var. Adresi: http://www.sipsakceviri.com/ Dil üzerine epeyi bir site inceleme fırsatım olduğu için rahatlıkla söyleyebilirim ki Türkiye&#8217;de bir eşi daha yok&#8230; Doğal dil algoritmaları, makinelerin insanları anlaması, anlambilim gibi alanlarda uğraştığımdan dil ile ilgili çeşitli tercüme siteleri, üniversitelerin yayın sayfaları, mt-archive.info gibi yerlere girip çıkmam gerekiyor. Ve [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=123&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>EC Tercüme Bürosu&#8217;nun <a title="Tercüme Bürosu" href="http://www.sipsakceviri.com/" target="_blank">Şip Şak Çeviri</a> diye bir sitesi var. Adresi: <a title="Tercüme Bürosu" href="http://www.sipsakceviri.com/" target="_blank">http://www.sipsakceviri.com/</a></p>
<p>Dil üzerine epeyi bir site inceleme fırsatım olduğu için rahatlıkla söyleyebilirim ki Türkiye&#8217;de bir eşi daha yok&#8230; Doğal dil algoritmaları, makinelerin insanları anlaması, anlambilim gibi alanlarda uğraştığımdan dil ile ilgili çeşitli tercüme siteleri, üniversitelerin yayın sayfaları, mt-archive.info gibi yerlere girip çıkmam gerekiyor. Ve gördüğüm kadarıyla EC Tercüme&#8217;ye az da olsa benzerbir firma Londra&#8217;da var, ve birkaç da ABD&#8217;de, hepsi o.</p>
<p>Peki farklı olan ne?.. Söyleyeyim: <a title="Yapay zeka nedir?" href="http://m.didikle.com/s/yapay-zeka-nedir" target="_blank">Yapay Zeka</a><br />
<strong></strong></p>
<p><strong>Şip Şak Çeviri&#8217;de belli ki yapay zeka ve ileri programlama kullanılmış.</strong></p>
<p>Öncelikle Türkiye&#8217;de başka hiçbir tercüme bürosunda öyle dosyayı yükleyeyim de hemen çeviri başlansın gibi bir hizmet yok&#8230; EC Tercüme gönderilen dosyanın ne olduğunu otomatik anlama işini başarmış.</p>
<p>Çalışma sistemi şöyle: Çevrilecek bir dosyanız var, belki ticari bir mektup belki bir akademik makale, belki bir ödev ya da belki bir CV&#8230; Bu dosyayı sitedeki ilgili formu kullanarak yüklüyorsunuz. Ve size bir fiyat ve süre verip soruyor: Çeviriye başlansın mı?</p>
<p><strong>E ne var bunda değil mi?.. Şu var:</strong></p>
<p>- Gönderdiğiniz dosyanın tipini anlıyor: PDF mi, DOC mu ne?.. E hadi bu da basit diyelim.</p>
<p>- Eğer bir sayfa taramış ve JPG olarak yüklemişseniz bunu düz yazıya dönüştürüp öyle yokluyor!&#8230; Hımm bu biraz zor işte&#8230; Başka?</p>
<p>- Gönderdiğiniz dosyanın <strong>dilini anlıyor!</strong>.. Nasıl yani değil mi?</p>
<p>- <strong>Kategorisini anlıyor!</strong>.. İşte bu da yukarıdaki gibi yapay zeka konularından. Burada olasılıkla bir classifier algoritması, <a title="Bayesian çıkarsama ve sınıflandırma" href="http://en.wikipedia.org/wiki/Bayesian_learning" target="_blank">Bayesian öğrenme</a> algoritması gibi bir teknik kullanılmış.</p>
<p>- Sizi anımsıyor ve daha önce gönderdiğiniz konuya benzer konu ise indirim uyguluyor!!.. Hımm bunda da yukardaki gibi bir benzerlik bulma yöntemi, veya <a title="Vektör Uzayı Modellemesi" href="http://www.scribd.com/doc/16574486/30/Vektor-Uzay%C4%B1-Modeli" target="_blank">çok boyutlu vektör uzayı modellemesi</a> kullanılmış olmalı&#8230; Giderek yüksek matematiğe el attılar farkındaysanız.</p>
<p>- Konuya en uygun çevirmen tahsisi yapılıyor&#8230; Gene benzer bir sınıflandırmaya ek olarak <em>kaynak tahsis algoritması</em> kullanılabilir.</p>
<p>- İmla hataları saptanıyor ve <strong>metin ne kadar hatasızsa o oranda indirim uygulanıyor!..</strong> Hadi bunu basit bir veritabanı yoklaması ile yapabilirler diyeceğim, ama Türkçe sözcükler ekleriyle birlikte milyonlarca farklı şekle bürünüyor&#8230; <a title="Zemberek Yazım Denetim Programı" href="http://code.google.com/p/zemberek/" target="_blank">Zemberek</a> gibi açık kaynak kodlu yazım denetimi kodları da yavaş. Yüklenen dosyayı saniyesinde işlemden geçirdiğini düşünürsek burada bir sihir var diyebiliriz.</p>
<p>- Bir de metin zorluğu hesaplıyormuş. Bunu ise klasik bir istatistik sayımla yapıyor olabilirler. Ya da <a title="Dale Chall Readibility" href="http://en.wikipedia.org/wiki/Readability_test" target="_blank">Dale Chall</a> gibi ilköğretim çocuklarına uygun metin seçmede kullanılan çeşitli hesaplamalar var. Ama Türkçe için yok. Belki onlar kullanılıyordur&#8230; Ama metin ne kadar kolaysa, o kadar indirim deniyor, ve metnin kolaylığını zorluğunu bilgisayar saptıyor ki işte bu da yapay zeka konusu aslında.</p>
<p>Güzel oluyor bu tür ileri teknolojileri Türkiye&#8217;de görmek&#8230;</p>
<p>Geriye bir tek <a title="Çeviri Bürosu" href="http://www.sipsakceviri.com/" target="_blank">EC Tercüme Bürosu</a>&#8216;nun bu Şip Şak İngilizce Türkçe Çeviri sitesinin konuşması kalmış, utanmasa <strong><em>&#8220;Kahve ister misiniz çeviri yapılırken?&#8221;</em></strong> diyecek! :)</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/123/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/123/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/123/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/123/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/123/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/123/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/123/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/123/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=123&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2011/12/07/ec-tercume-ve-sip-sak-ceviri-sitesi/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">aramarehberi</media:title>
		</media:content>
	</item>
		<item>
		<title>Ne var ne yok?</title>
		<link>http://diluzerine.wordpress.com/2011/12/06/ne-var-ne-yok/</link>
		<comments>http://diluzerine.wordpress.com/2011/12/06/ne-var-ne-yok/#comments</comments>
		<pubDate>Tue, 06 Dec 2011 11:32:40 +0000</pubDate>
		<dc:creator>aramarehberi</dc:creator>
				<category><![CDATA[Anlambilim]]></category>
		<category><![CDATA[arama motoru]]></category>
		<category><![CDATA[didikle]]></category>
		<category><![CDATA[semantik arama]]></category>
		<category><![CDATA[yanıt motoru]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=116</guid>
		<description><![CDATA[Eski bir fıkradır: Bir süperbilgisayar yapılmıştır, ne sorulsa yanıtlamaktadır&#8230; Her ülkeden bilim adamları gelir, bir şeyler sorar ve başarıyla yanıt alırlar bilgisayardan; ve bravo der çekilirler&#8230; Ve evet, sıra bize, bizim Temel&#8217;e gelir :) Ve Temel bilgisayara sorar: Ne var ne yok? *** Ve bu soruyu bir deyim olarak algılamayan bilgisayar, bilgi saymaya, evrende var [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=116&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><img class="alignright" title="Patlayan Bilgisayar" src="http://images.clipartof.com/small/22052-Clipart-Illustration-Of-A-Surprised-Man-Leaping-Back-From-His-Exploding-And-Smoking-Laptop-Computer-Poster-Art-Print.jpg" alt="Patlayan Bilgisayar Karikatürü" width="221" height="211" />Eski bir fıkradır:</p>
<p>Bir süperbilgisayar yapılmıştır, ne sorulsa yanıtlamaktadır&#8230; Her ülkeden bilim adamları gelir, bir şeyler sorar ve başarıyla yanıt alırlar bilgisayardan; ve bravo der çekilirler&#8230; Ve evet, sıra bize, bizim Temel&#8217;e gelir :)</p>
<p>Ve Temel bilgisayara sorar:</p>
<p>Ne var ne yok?</p>
<p>***</p>
<p>Ve bu soruyu bir deyim olarak algılamayan bilgisayar, bilgi saymaya, evrende var olan ve var olmayan her şeyi saymaya başlar&#8230;</p>
<p>Sayar&#8230; sayar&#8230; sayar&#8230; Ve dumanlar çıkararak patlar :)</p>
<p>***</p>
<p>Doğal dil ile çalışan, İngilizce ve Türkçe anlayan <a title="Didikle soru-yanıt motoru" href="http://m.didikle.com/" target="_blank">yanıt motoru</a> Didikle de patlıyor!..</p>
<p><a title="Didikle" href="http://m.didikle.com/" target="_blank">http://m.didikle.com/</a> adresine Firefox ile girip, Türkçe olarak</p>
<p><strong>ne var ne yok?</strong></p>
<p>diye sorarsanız :)</p>
<p><span style="color:#808080;"><em>not: Didikle&#8217;de başka sürpriz yumurtalar da var! Keşfetmekse eğlenceli :)</em></span></p>
<p><a target="_blank" href="http://www.sipsakceviri.com/" title="En iyi tercume burosu"><br />
<img width="468" height="60" src="http://www.sipsakceviri.com/resim/sipsakceviri-468x60-01b.png" title="En iyi tercume burosu" border="0" alt="[Sip Sak Ceviri]"></a></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/116/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/116/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/116/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/116/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/116/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/116/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/116/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/116/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=116&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2011/12/06/ne-var-ne-yok/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">aramarehberi</media:title>
		</media:content>

		<media:content url="http://images.clipartof.com/small/22052-Clipart-Illustration-Of-A-Surprised-Man-Leaping-Back-From-His-Exploding-And-Smoking-Laptop-Computer-Poster-Art-Print.jpg" medium="image">
			<media:title type="html">Patlayan Bilgisayar</media:title>
		</media:content>

		<media:content url="http://www.sipsakceviri.com/resim/sipsakceviri-468x60-01b.png" medium="image">
			<media:title type="html">En iyi tercume burosu</media:title>
		</media:content>
	</item>
		<item>
		<title>Duru Dil Üzərinə</title>
		<link>http://diluzerine.wordpress.com/2011/10/05/duru-dil-uz%c9%99rin%c9%99/</link>
		<comments>http://diluzerine.wordpress.com/2011/10/05/duru-dil-uz%c9%99rin%c9%99/#comments</comments>
		<pubDate>Wed, 05 Oct 2011 14:38:24 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[doğru Türkçe]]></category>
		<category><![CDATA[Duru dil]]></category>
		<category><![CDATA[Makine Çevirisi]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=111</guid>
		<description><![CDATA[Dili razılaşmaq üçün istifadə edirik. Izah etmək istədiklərimiz var. Bunu isə ilk insanların yaptğı kimi əlimizlə, kolumuzla, burnumuzla gösterek deyil, danışaraq izah etmək istəyirik. Nə qədər duru, o qədər yaxşı: &#8220;Əhməd, qaç!&#8221; Yoxsa: &#8220;Sevgili dostum Əhməd, epeyidir namüsait bir təşəkkül bulunduğunuzda ifadə etmədə cəhd gösterememle nəticəsində meydana çıxan, söyləyə bilmədim ki, gerinizden şəxs-ı alinize sürətlə yaxınlaşmaqda olan pitbull [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=111&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Dili razılaşmaq üçün istifadə edirik. Izah etmək istədiklərimiz var. Bunu isə ilk insanların yaptğı kimi əlimizlə, kolumuzla, burnumuzla gösterek deyil, danışaraq izah etmək istəyirik. Nə qədər duru, o qədər yaxşı:</p>
<p>&#8220;Əhməd, qaç!&#8221;</p>
<p>Yoxsa: &#8220;Sevgili dostum Əhməd, epeyidir namüsait bir təşəkkül bulunduğunuzda ifadə etmədə cəhd gösterememle nəticəsində meydana çıxan, söyləyə bilmədim ki, gerinizden şəxs-ı alinize sürətlə yaxınlaşmaqda olan pitbull terrier cinsinə aid bir Kəlb təhlükə ifadə edir olub, Sizin şəxsi basanlara dərz etmədə kes&#8217;in və də qərarlı bir görünüş ərz edirlər, halıyla, əlbət soruşar deyirsinizsə, şahsınıza tövsiyəm, dərhal mövcud mevkinizden yol alaraq təhlükəni aradan etmə səyi göstərməniz istiqamətindədir əfəndim &#8220;&#8230; mi deməli?</p>
<p><strong>Duru dil bir lazımlılıq</strong></p>
<p>Müxtəlif gündəlik danışıq yazıları üzərindəki hərf uzunluğu istatistiği 40-50 arası bir rəqəm göstərir. Yəni ortalama tümce uzunluğu 45 hərf. Ancaq, iş akademik yazılara, xəbərlərə, ədəbiyyat monologlarına gəlincə bu orta hesabla təxminən iki qatına çıxır. Səbəb: ədəbiyyat etmək!</p>
<p>İzah etmək istediklerimizi nə deyə aydın olmaz yazdığımızı sormayalım hələlik.Ancaq, aydın olmaq istəyiriksə; diyeceğimizi çoxu adam doğru anlasın istəyir isək mümkün duru danışmalı və yazmalıyız.</p>
<p>Əlbəttə, vaxt bunu umarsamadığını, lazım olsa öz-özünə danışmaq istədiyini söyləyənlər çıxacaq. Amma onsuz da öz-özünə danışanlara nə deyildiyini hamımız bilirik.</p>
<p><strong>Duru bir dil ilə yazıb danışmaq üçün bunları edə bilərik:</strong></p>
<p>- Cümlənin qısa tutmaq. Türkçe üçün 10-15, İngilis kimi bitişken olmayan dillər üçün 20 sözdən qısa tümce yazmaq faydalı.</p>
<p>- Ortaq sözləri seçmək: 70-80 milyon insanın danışdığı Türkiyə Türkcəsi ilə, 20-30 milyon insanın danışdığı Özbək Türkcəsi və 10-15 milyon insanın danışdığı Azəri türkcəsində ortaq istifadə edilən sözlər var. Məsələn, &#8216;çimərlik&#8217; və ya &#8216;sahil&#8217; demək yerinə qumlu demək, &#8216;lakin&#8217; &#8216;lakin&#8217; &#8216;amma&#8217; yerinə &#8216;ancaq&#8217; demək yazdıqlarımızı daha geniş kütlələr tərəfindən gələcəkdə də anlaşılma nisbətini artıracaq. Bundan başqa ortaq sözlər seçmək Türk dillərini də bir-birinə yaxınlaşdıracaq, gələcəkdə siyasi bir təzyiq gücü meydana gətirəcək bir-birlik meydana gətirmədə faydalı olacaq.</p>
<p>- Sözlərin daha qısa olan formalarını yeğlemek: Türkcədə 30.000 min qədər kök, təxminən 150 qədər əlavəsi müxtəlif sıralarla birdən çox dəfə ala bilir. Bir qisimi sözdizimsel (gramatik) baxımdan doğru olmasa da Türkcədə 100 milyondan daha çox bir söz forması meydana gətirə bilir.</p>
<p>Yenidən deyim: Üz milyondan daha çox söz forması var Türk dillərində. Bu böyük bir rəqəm. Dilini yeni öyrənənlər və ya Türkçe yazılardan mənalı məlumat parçaları ayıklamaya işləyən proqramların yaxşılığı üçün daha duru danışmalıyıq. Əgər bir sözü daha az əlavə, daha duru yazabiliyorsak, heç düşünmədən elə yazmalıyız.</p>
<p>- Gərəksiz sözləri elemek: Bu əslində Mark Twainin sözü. &#8221;Bir cümlənin bir sözcüyü atabileceğinizi düşünürsünüzsə, daha çox düşünmədən atın&#8221;. İzah etmək istəniləni nə qədər az sözlə diyebilirsek o qədər yaxşı.</p>
<p>- Söz qaydalarına uyğun gəlmək: Türkcədə cümlənin yükünü, adı üstündə yüklem daşıyır. Yüklem isə tümce sonundasan. Sözlərin bu formadakı dizilimine uymaq əhəmiyyətli. Çox yeni dil &#8220;Özne-Hərəkət-tamamlıq&#8221; formasını alarkən, Türkçe, Sümerce, Koreya, Yapon kimi köhnə bilmə &#8220;Özne-tamamlıq-Hərəkət&#8221; formasındadır. Bu quruluşa tabe olmaq və qorumaq, yenə duru bir ifadə üçün lazım və vacib. Yəni: &#8220;neçə itdən Əhməd&#8221; deyil, &#8220;Əhməd itdən neçə&#8221; demək doğru.</p>
<p>Bu vaxt, bəziləri Əhmədə itlərdən qaçmağı deyil onları pak bir şəkildə başa düşməyi də öyrətməli. Kim bilər, bəlkə də o itin tək dərdi bir oyun idi! :)</p>
<p><em>İlker Fıçıcılar</em><br />
&nbsp;</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/111/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/111/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/111/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/111/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/111/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/111/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/111/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/111/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=111&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2011/10/05/duru-dil-uz%c9%99rin%c9%99/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
		<item>
		<title>Örneğe-Dayalı Bilgisayar Çevirisi Makaleler Dizini</title>
		<link>http://diluzerine.wordpress.com/2010/08/28/ornege-dayali-bilgisayar-cevirisi-makaleler-dizini/</link>
		<comments>http://diluzerine.wordpress.com/2010/08/28/ornege-dayali-bilgisayar-cevirisi-makaleler-dizini/#comments</comments>
		<pubDate>Sat, 28 Aug 2010 18:10:23 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[doğru Türkçe]]></category>
		<category><![CDATA[Makine Çevirisi]]></category>
		<category><![CDATA[ÖDBÇ]]></category>
		<category><![CDATA[bilgisayar çevirisi]]></category>
		<category><![CDATA[BLEU]]></category>
		<category><![CDATA[EBMT]]></category>
		<category><![CDATA[Machine Translation]]></category>
		<category><![CDATA[MT]]></category>
		<category><![CDATA[SMT]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=104</guid>
		<description><![CDATA[Burada, Örneğe-Dayalı Bilgisayar Çevirisi (Example-Based Machine Translation) konulu Bilgisayarlı-Dilbilim makalelerini listelemeye çalışıyorum&#8230; Listenin zaman içinde büydüğünü görebilirsiniz&#8230; Konuyla ilgili iseniz ara ara uğrayıp yoklayabilirsiniz&#8230; Liste büyüyünce, &#8216;yeni eklenenler&#8217; adıyla açacağım ayrı bir sayfadan da güncellemeleri görebilirsiniz. Örneğe-Dayalı Bilgisayar Çevirisi, özellikle Türkçe konuşan biz 200-240 milyon kişiye ve gene benzer bitişimli (agglutinative) ve Özne-Tümleçler-Yüklem (SOV, Subject-Object-Verb) [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=104&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Burada, Örneğe-Dayalı Bilgisayar Çevirisi (Example-Based Machine Translation) konulu Bilgisayarlı-Dilbilim makalelerini listelemeye çalışıyorum&#8230; Listenin zaman içinde büydüğünü görebilirsiniz&#8230; Konuyla ilgili iseniz ara ara uğrayıp yoklayabilirsiniz&#8230; Liste büyüyünce, &#8216;yeni eklenenler&#8217; adıyla açacağım ayrı bir sayfadan da güncellemeleri görebilirsiniz.</p>
<p>Örneğe-Dayalı Bilgisayar Çevirisi, özellikle Türkçe konuşan biz 200-240 milyon kişiye ve gene benzer bitişimli (agglutinative) ve Özne-Tümleçler-Yüklem (SOV, Subject-Object-Verb) yapıdaki dünya dilleri için çok daha başarılı bir teknik. Bu SOV tipi diller azımsanmayacak çoklukta. Hintçe ve diğer Hint dilleri bu yapıda örneğin. Japonca ve Korece ise hem bitişimli ve SOV hem de Türkçe ile çok benzer kalıplara sahip&#8230; Sonra Çince, Mandarin her ne kadar fiil genelde önce diye SVO kabul edilse de tamlamalar, ki bunlar bilgisayar çevirisinde asıl sorunsal kısımlar, SOV dillerdeki gibi.</p>
<p>Dünya Anglo-Sakson değil&#8230; Türk dilleri dünyada en yaygın konuşulan 5. dil&#8230; Ve Google Translate&#8217;in çerçöp çevirisinden de görebileceğimiz gibi yapısal bir derinliği olmadığından, çok fazla istisnai kurallara sahip Anglo-Sakson dilden, İngiliz dilinden Türkçe&#8217;ye ve diğer dünya dillerine yapılan çeviriler çok kötü bir kalitede.</p>
<p>2010 itibariyle günümüzde yaygın Bilgisayar Çevirisi tekniği İstatistiksel Bilgisayar Çevirisi (SMT). Bu teknik Hispanik dillerde görece bir başarı sağlıyorken, sözcük dizimi baştan aşağı farklı olan diğer dünya dilleri karşısında oldukça başarısız&#8230;</p>
<p>Bunun birkaç sebebi var: Bitişimli diller (Türkçe, Korece, Japonca, Fince, Macarca, &#8230;) çok daha fazla sözcüğe sahip ve GIZA++ sözcük eşleme koduyla yapılan sözcük eşlemeleri Avrupa dileri ile Bitişimli diller arasında eşleme (alignment) yaparken çok fazla boş-eşleme (null-alignment) ve yanlış eşleme yapıyor. Bir diğer sebep de, SOV diller ile SVO diller arasındaki sözcük diziminin cümle uzadıkça oldukça farklılaşması. Bu durum ise, SMT tekniğinde Dil Modellemsine bakarak doğru cümleyi kurmaya çalışması için çok daha fazla bir olasılık uzayını taramasını (beam search) gerektiriyor. Pratikte ise bu çok zaman alıcı bir süreç ve tarama işlemi belli bir süre geçilince, kullanıcyı bekletmemek adına kesiliyor&#8230; Sonuç ise Google Translate&#8217;te görebileceğiniz gibi sözcük çorbaları oluyor.</p>
<p>EBMT (ÖDBÇ &#8211; Örneğe-Dayalı Bilgisayar Çevirisi) tekniğinde ise bu sorunlar yok. Ama başka sorunlar var&#8230; Ve 1990&#8242;ların başında yeterli Derlem (Corpus) ve bilgisayar gücü olmadığından, hazır SMT de ortaya çıkmışken, çoğu bilim adamı çalışmalarını SMT&#8217;ye kaydırdı ve EBMT bir biçimde oldukça geri planda kalmış oldu&#8230;</p>
<p>Çalışmaları sekteye uğratan bir başka nokta ise BLEU ölçümünün icadı oldu. BLEU, referans çevirilere bakarak Bilgisayar Çevirisinin başarısını ölçmeye çalışan bir yöntem. Bilgisayar çevirisinin ürettiği ardışık sözcük dizilerinin, daha önce bir insan tarafından çevilmiş referans çevirilerle karşılaştırılması ile elde edilip 0-1 veya 0-100 arasında temsil edilen bir sayı&#8230;</p>
<p>Ancak bir sorun var: SOV türü diller görece hareketli bir sözcük sırasına sahipler&#8230; Bir tek Yüklemin sonda olması, devrik cümle olmaması açısından önemli. Geri kalan sözcükler ise, yapısal özellikler eklerle zaten belirtilmiş olduğundan vurgulanmak istenen öğe yükleme yaklaşacak şekilde cümle içinde hemen her yerde olabilir&#8230; Örneğin şu meşhur reklamı anımsayalım: &#8220;Turkcell&#8217;le bağlan hayata&#8230; Hayata bağlan Turkcell&#8217;le&#8230; Bağlan Turkcell&#8217;le hayata&#8230; Bağlan hayata&#8230; vs. vs. &#8230;&#8221; Bunların hepsinde anlam aynı. Hepsi de doğru. Ancak BLEU ölçüsü yalnızca birini, çevirmenin tercih etmiş olduğu örneği doğru kabul edecek, diğerleri için 0 rakamını uygun görüp hatalı kabul edecektir&#8230;</p>
<p>İşte bu BLEU sorunu yüzünden de Türkçe gibi SOV dillere bilgisayar çevirilerinin SMT ile düzgün yapılması mümkün olamıyor. SMT Makine Çevirisi sistemleri eğitilirken kullanılan MERT (Minimum Error Rate Training) yönteminde BLEU ölçüsü kullanılıyor çünkü.</p>
<p>ÖDBÇ (EBMT) tekniğinde ise daha önce insanlar tarafından çevrilmiş örneklere bakılarak şablonlar ve çeviri parçacıkları sapanıp çıkarılıyor, ve çeviri anında en benzer şablona en benzer parçacıklar yapıştırılıyor&#8230; Bu teknik, belli bir konuya odaklanmış çevirilerde (sadece tıp, sadece elektronik, sadece bilgisayar oyunları, sadece yeni mobil teknolojiler, vs. vs. gibi dar bir alanda) oldukça başarılı çeviriler üretiyor&#8230; Konu dışına çıkıldığında ise neredeyse hiç çeviri üretemiyor. Ya hep, ya hiç&#8230; İşte bu aşağıdaki EBMT makaleleri listesinde bu teknik üzerine çalışmaları bulabileceğiz:</p>
<p><strong>EBMT Makaleleri</strong></p>
<p>Adetten olduğu üzere, Örneğe-Dayalı Bilgisayar Çevirisi yönteminin buluşçusu ile, konuya ilişkin ilk makale ile başlayalım:</p>
<p><strong>(1984) </strong>Makoto Nagao: <a href="http://www.mt-archive.info/Nagao-1984.pdf">A framework of a mechanical translation between Japanese and English by  analogy principle</a>,  <em>Artificial and human intelligence</em>: edited review papers presented at the international  NATO Symposium, October 1981, Lyons,  France;  ed. A. Elithorn and R. Banerji. Amsterdam: North Holland, 1984; pp. 173-180. [PDF, 260KB]</p>
<p><strong>Ve güncelliğine ve önemine göre başka makaleler:</strong></p>
<p><strong>(2010)</strong> Kim, J., Brown, R. and Carbonell, J. &#8220;<a title="Chunk Based EBMT 2010" href="http://www.cs.cmu.edu/~jgc/publication/Chunk-Based_EBMT_2010.pdf" target="_blank">Chunk-Based EBMT</a>.&#8221; In Proceedings  of the 14the Workshop of the European Association for Machine  Translation, Raphael, France, 2010.</p>
<p>Bizden, getirdiği şablon saptama yöntemi sayesinde en çok atıf alan makalelerden, Sayın İlyas Çiçekli ile Altay Güvenir&#8217;in makaleleri:</p>
<p><strong>(1998)</strong> H.Altay Güvenir &amp; Ilyas Cicekli: <a href="http://www.mt-archive.info/InformationSystems-1998-Guvenir.pdf">Learning translation  templates from examples</a>. <em>Information Systems</em>, vol. 23, no.6; pp.353-363. [PDF, 51KB]</p>
<p><strong>(2001)</strong> Ilyas Cicekli &amp; H.Altay Güvenir: <a href="http://www.mt-archive.info/AppIntell-2001-Cicekli.pdf">Learning  translation templates from bilingual translation examples</a>. <em>Applied  Intelligence</em>, vol.15, no.1; pp.57-76.  [PDF, 251KB]</p>
<p><strong>Birbirine oranlı benzerlikler</strong> (proportional analogies) yaklaşımı (Bu oldukça ilginç ve zekice bir yöntem; gelecek vaadediyor):</p>
<p><strong>(2009) </strong>Harold Somers, Sandipan Dandapat, &amp; Sundip Kumar Naskar: <a href="http://www.mt-archive.info/EBMT-2009-Somers.pdf">A review of EBMT  using proportional analogies</a>. <em>Proceedings of the 3rd International Workshop on Example-Based Machine Translation</em>, 12-13 November 2009, Dublin City University, Dublin, Ireland, ed. Mikel  L. Forcada [and] Andy Way; pp.53-60. [PDF, 337KB]</p>
<p><strong>(2005)</strong> Yves  Lepage &amp; Etienne Denoual: <a href="http://www.mt-archive.info/MTS-2005-Lepage.pdf" target="_blank">The  ‘purest’ EBMT system ever built: no variables, no templates, no training, examples, just examples, only  examples</a><em> MT Summit X, Phuket, Thailand, September 16, 2005, Proceedings of Second Workshop on Example-Based Machine  Translation</em>; pp.81-90. [PDF, 400KB]</p>
<p><strong>(2005)</strong> Yves Lepage &amp;  Etienne Denoual: <a href="http://www.mt-archive.info/IWSLT-2005-Lepage.pdf">ALEPH: an EBMT  system based on the preservation of proportional analogies between sentences across langauges</a>. <em>International Workshop on Spoken Language Translation: Evaluation Campaign on Spoken Language Translation [IWSLT  2005], </em>24-25 October, 2005, Pittsburgh,  PA, USA; 8pp. [PDF, 388KB]</p>
<p><strong>(2007)</strong> Yves Lepage &amp;  Adrien Lardilleux: <a href="http://www.mt-archive.info/IWSLT-2007-Lepage.pdf">The GREYC  machine translation system for the IWSLT 2007 evaluation campaign</a>. <em>IWSLT 2007: International Workshop on Spoken Language Translation</em>, 15-16  October 2007, Trento, Italy. 7pp. [PDF, 312KB]; <a href="http://www.mt-archive.info/IWSLT-2007-Lepage-ppt.pdf">presentation</a> [PDF, 584KB]</p>
<p><strong>(2009)</strong> Yves Lepage, Adrien Lardilleux, &amp; Julien Gosme: <a href="http://www.mt-archive.info/IWSLT-2009-Lepage.pdf">The GREYC translation memory for the IWSLT 2009 evaluation campaign: one step  beyond translation memory</a>. <em>IWSLT 2009:</em> <em>Proceedings of the  International Workshop on Spoke n Language Translation</em>, National Museum of  Emerging Science and Innovation, Tokyo, Japan, December 1-2, 2009; pp. 45-49.  [PDF, ];</p>
<p><strong><br />
</strong></p>
<p><strong>Şablon temelli sistemler</strong>e örnek, Ralf Brown&#8217;un Pangloss&#8217;u&#8230; Giderek bir hibrit sisteme dönüşse de, içindeki EBMT modülü oturmuş bir sistem ve Açık Kaynak kodlu olarak Sourceforge&#8217;dan indirilebiliyor:</p>
<p><strong>CMU-EBMT</strong> kaynak kodu: <a title="CMU EBMT" href="http://cmu-ebmt.sourceforge.net" target="_blank">http://cmu-ebmt.sourceforge.net</a></p>
<p><strong>(1994)</strong> Robert Frederking,  Sergei Nirenburg, David Farwell, Steven Helmreich, Eduard Hovy, Kevin Knight, Stephen Beale, Constantine  Domashnev, Donalee Attardo, Dean Grannes, &amp; Ralf Brown: <a href="http://www.mt-archive.info/AMTA-1994-Frederking.pdf">Integrating translations from multiple sources within the PANGLOSS Mark III machine translation system</a>. <em>Technology partnerships for crossing the language barrier: Proceedings of the First Conference of the Association for Machine Translation in the  Americas,5-8 October, Columbia, Maryland, USA</em>. [Washington,  DC: AMTA]; pp. 73-80.  [PDF, 137KB]</p>
<p><strong>(2000)</strong> Ralf D.Brown: <a href="http://www.mt-archive.info/Coling-2000-Brown.pdf">Automated generalization of translation examples</a>. <em>Coling 2000 in Europe: the 18th International Conference on Computational Linguistics</em>. Proceedings of the  conference, Universität des Saarlandes, Saarbrücken,  Germany,  31 July -4 August 2000; pp. 125-131 [PDF,.650KB]</p>
<p><strong>(2003)</strong> Ralf D.<strong> </strong>Brown,<strong> </strong>Rebecca<strong> </strong>Hutchinson,<strong> </strong>Paul  N.<strong> </strong>Bennett, Jaime G<strong>. </strong>Carbonell, &amp;  Peter<strong> </strong>Jansen<strong><em>: </em></strong><a href="http://www.mt-archive.info/MTS-2003-Brown.pdf">Reducing boundary  friction using translation-fragment overlap</a>. <em>MT  Summit IX</em>, New Orleans,  USA,  23-27 September 2003; pp.24-31. [PDF, 117KB]</p>
<p><strong><br />
</strong></p>
<p><strong>Karışık sırayla önemli başka EBMT konulu makaleler:</strong></p>
<p><strong>(2005)</strong> Sudip Kumar Naskar  &amp; Sivaji Bandyopadhyay: <a href="http://www.mt-archive.info/MTS-2005-Naskar-1.pdf">A phrasal EBMT  system for translating English to Bengali</a><em>. MT  Summit X, Phuket, Thailand, September 13-15, 2005, Conference Proceedings: the tenth Machine Translation Summit; pp.372-379.</em> [PDF, 263KB]</p>
<p><strong>(2004)</strong> Gábor Hodász, Tamás  Gröbler, &amp; Balázs Kis: <a href="http://www.mt-archive.info/EAMT-2004-Hodasz.pdf">Translation memory as a robust example-based translation system</a> <em>9th EAMT Workshop,  &#8220;Broadening horizons of machine translation and its applications&#8221;, 26-27 April 2004, Malta; </em>pp.82-89. [PDF,  227KB]</p>
<p><strong><br />
</strong></p>
<p><strong>Geçen Kasım ayındaki EBMT konferansı bildirileri:</strong></p>
<p>Proceedings of the<strong> 3<sup>rd</sup> International Workshop on Example-Based Machine Translation</strong>, 12-13 November 2009 &#8211; Centre for Next Generation Localisation, Dublin City  University, Dublin, Ireland<em>; Edited  by</em> Mikel L.  Forcada, Andy Way   <a title="EBMT 2009" href="http://www.mt-archive.info/EBMT-2009-TOC.htm" target="_blank">http://www.mt-archive.info/EBMT-2009-TOC.htm</a></p>
<p>Bu listenin devamı gelecek. Yukarıdakilerin arasına ve/veya buradan aşağıya yeni eklemeler olacak.</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/104/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/104/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/104/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/104/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/104/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/104/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/104/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/104/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=104&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2010/08/28/ornege-dayali-bilgisayar-cevirisi-makaleler-dizini/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
		<item>
		<title>Bir Makalenin Özgün Bir Makale Olup Olmadığını Anlamak İçin Bir Yöntem</title>
		<link>http://diluzerine.wordpress.com/2010/08/28/bir-makalenin-ozgun-bir-makale-olup-olmadigini-anlamak-icin-bir-yontem/</link>
		<comments>http://diluzerine.wordpress.com/2010/08/28/bir-makalenin-ozgun-bir-makale-olup-olmadigini-anlamak-icin-bir-yontem/#comments</comments>
		<pubDate>Sat, 28 Aug 2010 16:36:23 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[Anlambilim]]></category>
		<category><![CDATA[dil]]></category>
		<category><![CDATA[dilbilim]]></category>
		<category><![CDATA[doğal dil işleme]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[vektör uzayı modeli]]></category>
		<category><![CDATA[veri madenciliği]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=91</guid>
		<description><![CDATA[Web sitenize yüklenen bir makalenin özgün olup olmadığını, ya da sizin sitenizdeki makaleleri aşıranların kimler olduğunu otomatik olarak saptamanın bir yolu var.<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=91&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><em><strong>Karışık göründüğüne bakmayın&#8230; Anlattığımı yapması, buraya yazmasından daha kolay&#8230; Dikkatini verip iyice inceleyenler, çok çok sürpriz uygulama sahalarını da fark edecekler yöntemin ;) bir sır&#8230;</strong></em></p>
<p>Web sitenize yüklenen bir makalenin özgün olup olmadığını, ya da sizin sitenizdeki makaleleri aşıranların kimler olduğunu otomatik olarak saptamanın bir yolu var.</p>
<p><strong>Vektör Uzayı Modeli</strong> denen yöntemle makalelerin birbirlerine benzerliklerini karşılaştırabilirsiniz.</p>
<p>Bu yöntem şu şekilde kullanılıyor:</p>
<p>Önce makalelerin farklılıklarını temsil edebilecek bir sözcük listesi oluşturuyoruz. Bu liste, bir makalede sık geçen ama makaleler arasında az geçen sözcüklerden seçilerek oluşturuluyor. Sonra bu listeyi bir dizine alıyoruz, ve listedeki her bir sözcüğü sanki çok boyutlu bir vektörün değişkeni imişçesine işliyoruz. Bir makaledeki bu listede olan sözcüklerin görülme sıklıklarının 0-1 normalizasyonu bizim vektörümüzün katsayıları olacak.</p>
<p>Örneğin listemizde &#8220;fizik&#8221; sözcüğü varsa, ve 321 sözcüklük bir makalede 12 kez &#8220;fizik&#8221; geçiyorsa katsayımız: 12/321=0.0373831 olacak. Elimizdeki her makale için oluşturduğumuz listede bulunan sözcükler varsa bu katsayıları hesaplayıp bir dizine alıyoruz. Bu bizim çok boyutlu vektörümüz.</p>
<p>Malum, vektörler yön gösterir. Ok şekliyle ifade ederiz fizikte, matematikte zaten. İşte bu vektörleri elde ettikten sonra aynı yönü işaret edip etmediklerine bakıyoruz, aynı yöne doğru bakan vektörlerin temsil ettikleri makaleler benzerdir. Benzerlik oranı, iki vektörün arasındaki açıyla orantılı.</p>
<p>İki vektör arasındaki açıyı ise bu iki vektörün nokta çarpımını, vektörlerin determinantlarının çarpımına bölerek bulabiliriz. Bu bölüm bize açının kosinüsünü verecektir. Yani tam olarak aynı noktaya bakıyorlarsa 1, ortogonallerse, dik açı yapıyorlarsa 0 değerini alacağız.</p>
<p>Matematik ifadesi:</p>
<blockquote><p><strong>cos(açı) = vektör1 . vektör2 / (det(vektör1)*det(vektör2))</strong></p></blockquote>
<p>Örneğin vektör1, özgün olup olmadığını merak ettiğimiz makalenin vektörü olsun, vektör2&#8242;ler de sırayla daha önce web sitemize yüklenmiş makalelerin vektörleri olsun tek tek.</p>
<p>Ya da vektör1 sizin rakibiniz bir web sitesine yeni yüklenmiş bir makalenin vektörü, vektör2&#8242;ler de sırayla sizin sitenizdeki makalelerin vektörleri olabilir. Böylece rakip site sizden makale aşırdıysa bunu hemen anlayabilirsiniz.</p>
<p>Yapması anlatmasından daha kolay. Örnekliyorum:</p>
<p><span id="more-91"></span></p>
<p>Örnek bir sözcük listemiz olsun bu aşağıdaki, yalnzıca 8 sözcük olduğundan 8 boyutlu bir uzaydaki bir vektör bu. Sizinse sağlıklı bir makale ayırdetme için 1000 boyutlu bir uzayda çalışmaya, ve uygun ayırtedici bir sözcük listesine ihtiyacınız olacak:</p>
<blockquote><p><strong>$eslenik=array(<br />
&#8216;bir&#8217;,<br />
&#8216;ve&#8217;,<br />
&#8216;ekran&#8217;,<br />
&#8216;Windows&#8217;,<br />
&#8216;bu&#8217;,<br />
&#8216;Samsung&#8217;,<br />
&#8216;olarak&#8217;,<br />
&#8216;Mobile&#8217;<br />
);</strong></p></blockquote>
<p>Şimdi vektörleri tutacak bir SQL tablosu hazırlayalım. 8 tane için hadi neyse de 1000 tane için bir tabloyu elle yazmak akılcıl değil, bizim yerimize bir program yazsın:</p>
<p><code>&lt;?php<br />
$adet=8;</code></p>
<p>echo &#8220;<br />
USE vektoruzayideneme;</p>
<p>#drop table vsmvektor;</p>
<p>CREATE TABLE `vsmvektor` (<br />
`no` int(11) unsigned NOT NULL auto_increment,<br />
`zaman` timestamp(14) NOT NULL default &#8221;,<br />
`durum` tinyint unsigned NOT NULL default 0,<br />
&#8220;;<br />
for($i=0;$i&lt;$adet;$i++) {<br />
$j=$i;<br />
if ( $i &lt; 1000 ) $j=&#8221;0&#8243;.$i;<br />
if ( $i &lt; 100 ) $j=&#8221;00&#8243;.$i;<br />
if ( $i &lt; 10 ) $j=&#8221;000&#8243;.$i;<br />
echo &#8221;  `k&#8221;.$j.&#8221;` float NOT NULL default 0,\n&#8221;;<br />
}</p>
<p>echo &#8221;  PRIMARY KEY `no` (`no`),<br />
KEY `zaman` (`zaman`),<br />
KEY `durum` (`durum`)<br />
) TYPE=MyISAM;<br />
&#8220;;<br />
?&gt;</p>
<p>bunu deneme.php diye kaydedip, çalıştırıp çıktısını bir yere yazıp mysql&#8217;e verelim:</p>
<blockquote><p>#php deneme.php &gt; vektorler.sql<br />
#mysql &lt; vektorler.sql</p></blockquote>
<p>Bu &#8220;vsmvektor&#8221; adlı bir veritabanı tablosu oluşturttu bize.</p>
<p>Devam edelim, ve bir yazının vektörünü hesaplayan işlevi yazalım:</p>
<pre>function f_vsmvektorbul($eslenik,$yazi) {

$vektor=array();
$sayac=array();
$say=0;
$esadet=count($eslenik);
$dyazi=str_replace("\r"," ",$yazi);
$dyazi=str_replace("\n"," ",$dyazi);
$dyazi=str_replace("\t"," ",$dyazi);
$dyazi=preg_replace("/([[:punct:][:digit:] ]+)/"," ",$dyazi);
$dyazi=trim($dyazi);
$metin=explode(" ",$dyazi);
$ydizi=array_count_values($metin);
$adet=count($metin);
for($j=0;$j&lt;$esadet;$j++) {
if ( $ydizi[$eslenik[$j]] == "" ) {
$tane=0;
} else {
$tane=$ydizi[$eslenik[$j]];
}
$vektor[$j]=$tane/$adet;

} // for j

return $vektor;
}
?&gt;</pre>
<p>Burada $eslenik dizisi (array) işte o bizim çıkardığımı özel sözcük listesi. $yazi ise çok boyutlu vektörü bulunacak düz yazı biçiminde makale. İşlevin yaptığı ise basit, sözcükleri sayıyor yüzdesini bulup 0-1 normalizasyonlu olarak bir vektör (bu durumda bir array/dizi) döndürüyor.</p>
<p>Bu vektörleri hesapladıkça veritabanına sokacağımız bir işlev daha yazalım:</p>
<p><code>function f_vsmvektorsok($vektor) {<br />
$maks=8;<br />
$adet=count($vektor);<br />
if ( $adet &gt; $maks ) $adet=$maks;</code></p>
<p>$komut=&#8221;INSERT INTO vsmvektor (&#8220;;<br />
for($i=0;$i&lt;$adet;$i++) {<br />
$j=$i;<br />
if ( $i &lt; 1000 ) $j=&#8221;0&#8243;.$i;<br />
if ( $i &lt; 100 ) $j=&#8221;00&#8243;.$i;<br />
if ( $i &lt; 10 ) $j=&#8221;000&#8243;.$i;<br />
$komut.=&#8221;k&#8221;.$j.&#8221;,&#8221;;<br />
}<br />
$komut.=&#8221;zaman) VALUES (&#8220;;</p>
<p>for($i=0;$i&lt;$adet;$i++) {<br />
$komut.=$vektor[$i].&#8221;,&#8221;;<br />
}<br />
$komut.=&#8221;NOW());&#8221;;</p>
<p>mysql_query($komut);<br />
$no=mysql_insert_id();</p>
<p>return $no;<br />
}</p>
<p>İşlevin içine $maks değişkeni ile sözcük listemizin uzunluğunu (vektör uzayımızın boyutuna denk) belirtmeyi unutmuyoruz. Bu örnek için 8. İşlevin yaptığı ise o uzun mysql komutunu oluşturmak, bununla vektör katsayılarınaı veritabanına sokmak ve bize nereye soktuğu bilgisini döndürmek. Bu vektör numarasını programınızda ilgili makalenin numarası ile eşleştirmeyi unutmamalısınız. Bu ayrıntıları yazı uzamasın diye yazmıyorum çünkü.</p>
<p>Pratik örneklerle devam edelim:</p>
<p>İki vektör arasındaki açıyı hesaplayalım:</p>
<p><code>function f_vsmacisi($vek1,$vek2) {<br />
$tane=count($vek1);<br />
$noktacarpimi=0;<br />
for ($i=0;$i&lt;$tane;$i++) $noktacarpimi=$noktacarpimi+$vek1[$i]*$vek2[$i];<br />
$det1=0;<br />
for ($i=0;$i&lt;$tane;$i++) $det1=$det1+$vek1[$i]*$vek1[$i];<br />
$det1=sqrt($det1);<br />
$det2=0;<br />
for ($i=0;$i&lt;$tane;$i++) $det2=$det2+$vek2[$i]*$vek2[$i];<br />
$det2=sqrt($det2);<br />
$costheta=0;<br />
if ( $det1 != 0 &amp;&amp; $det2 != 0 ) {<br />
<strong>$costheta=$noktacarpimi/($det1*$det2);</strong><br />
}<br />
<strong>$costheta=log10(1+$costheta*9);</strong><br />
return $costheta;<br />
} // func. f_vektoracisi</code></p>
<p>Yukarıda verdiğim matematik formulüne bir ek yaptım bu örnekte. Dikkat ederseniz cos(açı) yerine 10 tabanında logaritmasını döndürüyorum. Bu, eğer az sözcükle çalışıyorsanız, vektör arasındaki farklılıkları sivriltmeye yarıyor. Log10(1) 0 değerini verir, log10(10) da 1. Ama logaritma sayesinde 1&#8242;e yakın olanlar daha yaklaşır, 0&#8242;a yakın olanlar da 1&#8242;den daha uzaklaşır. Birbirine benzese de az benzeyen makaleleri daha kolay ayırt edebiliriz böylece.</p>
<p>Kullanımı ise şöyle:</p>
<p><code>$makale1=file_get_contents("http://birsiteninbirmakalesi.html");<br />
$makale1=trim(preg_replace("/( +)/"," ",preg_replace("//U"," ",$makale1)));<br />
$makale2=file_get_contents("birbaşka.html");<br />
$makale2=trim(preg_replace("/( +)/"," ",preg_replace("//U"," ",$makale1)));<br />
// veya $makale2=file_get_contents("birbaşka.txt");<br />
// kısaca düz yazı olacak bunlar.<br />
// Ayrıca UTF-8 ve ISO-8859-9 farklılıklarını ve diğer ayrıntıları unutmamalı,<br />
// ilgili dönüşümleri ayrıca yapmalısınız.</code></p>
<p>$vektor1=f_vsmvektorbul($eslenik,$makale1);<br />
$vektor2=f_vsmvektorbul($eslenik,$makale2);</p>
<p>$benzerlik=f_vsmacisi($vektor1,$vektor2);<br />
if ( $benzerlik &gt; 0.95 ) echo &#8220;Vay uyanık, bu makaleler hık demiş burunlarından düşmüş.&#8221;;</p>
<p>Bunun bir kullanımı daha var. Eğer sitenizdeki her makalenin vektörlerini sql&#8217;de depolar, ve yeni bir tablo daha oluşturup buna da her makale çiftinin birbirleri ile olan açılarını kaydederseniz birbiri ile ilgili makaleleri bulabilirsiniz. Tek yapmanız gereken o an gösterilmekte olan makalenin bu tablodaki açılarıdan, mesela 0.5&#8242;ten daha büyük olduğu diğer vektörleri sql ile sorgulatmak ve denk gelen makaleleri çekip önermek: &#8220;Bu makaleler de ilginizi çekebilir&#8221; şeklinde.</p>
<p>Ya da otomatik kategorilendirme uygulamaları, veya başka türlü semantik kullanım uygulamaları da yapabilirsiniz.</p>
<p>Kolay gelsin.</p>
<p><em><strong>İlker Fıçıcılar</strong><br />
4 Haziran 2010 </em></p>
<p><em><br />
</em></p>
<p><strong>Yedeği: </strong>Bu makalenin bir yedeği <a href="http://www.klavyemonitor.com/Bir_Makalenin_Ozgun_Bir_Makale_Olup_Olmadigini_Anlamak_Icin_Bir_Yontem.html">http://www.klavyemonitor.com/Bir_Makalenin_Ozgun_Bir_Makale_Olup_Olmadigini_Anlamak_Icin_Bir_Yontem.html</a> adresinde bulunabilir. (Yazıyı buraya WordPress&#8217;e alırken kimi yerlerde çift ve tek tırnaklar dönüşüme uğramış olabilir. Kodları bilgisayara geçirirken dikkatli olmalı.)</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/91/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/91/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/91/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/91/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/91/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/91/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/91/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/91/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=91&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2010/08/28/bir-makalenin-ozgun-bir-makale-olup-olmadigini-anlamak-icin-bir-yontem/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
		<item>
		<title>Bask Dili</title>
		<link>http://diluzerine.wordpress.com/2010/08/28/bask-dili/</link>
		<comments>http://diluzerine.wordpress.com/2010/08/28/bask-dili/#comments</comments>
		<pubDate>Sat, 28 Aug 2010 16:24:44 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[Genel]]></category>
		<category><![CDATA[Adige]]></category>
		<category><![CDATA[Çerkesçe]]></category>
		<category><![CDATA[Bask dili]]></category>
		<category><![CDATA[Baskça]]></category>
		<category><![CDATA[dil]]></category>
		<category><![CDATA[Gürcüce]]></category>
		<category><![CDATA[Türkçe]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=87</guid>
		<description><![CDATA[Baskça, bir tek Avrupa'nın Batısında konuşuluyor olsa da, sözdizimi kuralları açısından Adige ve Kabardey Çerkesce'sine, bir ölçüde Gürcüce'ye ve kısmen de Türkçe'ye benzer.<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=87&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><em>Baskça, bir tek Avrupa&#8217;nın Batısında konuşuluyor olsa da, sözdizimi kuralları açısından Adige ve Kabardey Çerkesce&#8217;sine, bir ölçüde Gürcüce&#8217;ye ve kısmen de Türkçe&#8217;ye benzer.</em></p>
<p>Bask dili ya da Baskça İspanya&#8217;nın Bask özerk bölgesindeki ve Fransa&#8217;nın Güney Batısında kalan Bask bölgesindeki Baskların konuştuğu dildir. Kendilerinin Euskara diye adlandırdıkları bu dile yalıtık dillerdendir denir (language isolate). Avrupa kıtasında Baskların kökeni veya akrabası olabilecek başka bir etnik grup veya dil ailesi bulunmadığından yalıtık diye nitelendirilmiş olsa da, Baskça sözdizimi kuralları (gramer) açısından Adige ve Kabardey Çerkesce&#8217;sine, bir ölçüde Gürcüce&#8217;ye ve kısmen de Yenisey Türkçesine benzer.</p>
<p>Tümce kuruluş yapıları ve kimi sözcükleri ise Türkçe&#8217;ye benzemektedir. Tümceler &#8220;özne &#8211; tümleçler &#8211; yüklem&#8221; biçimindedir. Yüklem Türkçe&#8217;deki gibi gizli özneyi de içerir. Gene adı gibi yüklem tümcenin hemen hemen tüm sentetik yükünü yüklenir, tıpkı Türkçe&#8217;deki gibi. Gene Çerkesce ve Türkçe&#8217;deki gibi vurgulanmak istenen noktalar yükleme yaklaştırılır. Ve gene benzer biçimde özneler eğer vurgu yapılmayacaksa çıkartılır. Türkçe&#8217;den farklı olaraksa özne, tümlece göre farklı ek almaktadır.</p>
<p>Abecesi fonetiktir. Birkaç harf dışında yazıldığı gibi okunur. Özgün Baskça&#8217;da c sesi kullanılmaz. rr ve ll uzun sesleri vardır, tx ç diye, tz ş diye okunur.</p>
<p>Birkaç Baskça sözcük örneği (Swadesh listesinden alıntı):</p>
<p><span id="more-87"></span></p>
<p>Ben: ni<br />
Sen: hi, zu<br />
O: hura, bera<br />
Biz: gu<br />
Siz: zuek<br />
Onlar: haiek<br />
Bu: hau<br />
Şu: hori, hura<br />
Bura(da/sı): hemen, hon-<br />
Ora(da/sı): hor, han<br />
&#8230;<br />
Sorular n&#8217;li:<br />
Kim: nor<br />
Ne: zer<br />
Nerede: non<br />
Ne zaman: noiz<br />
Nasıl: nola<br />
&#8230;<br />
Bir: bat<br />
İki: bi<br />
Üç: hiru<br />
Dört: lau<br />
Beş: bost<br />
&#8230;<br />
Ağır: astun<br />
Küçük: txiki (çiki okunur)<br />
Kadın: emakume<br />
Erkek: gizon<br />
Kişi: gizaki<br />
Çocuk: haur, ume, sein<br />
Anne: ama<br />
Baba: aita<br />
&#8230;<br />
Kuş: txori<br />
Köpek: txakur<br />
Yumurta: arrautza<br />
&#8230;<br />
Deri: larru<br />
Kulak: belarri<br />
Göz: begi<br />
Burun: sudur<br />
Ağız: aho<br />
Diş: hortz, hagin<br />
Dil: mihi<br />
Tırnak: azkazal<br />
Ayak: oin<br />
&#8230;<br />
Gör-/Gözle-(mek): ikusi-<br />
İşit-(mek): entzun- (enşun)<br />
Öl-(mek): hil-<br />
Öldür-(mek): erahil-<br />
&#8230;<br />
Beyaz: zuri<br />
Siyah: beltz<br />
Kırmızı: gorri<br />
Yeşil: berde, orlegi<br />
Sarı: hori<br />
Yıl: urte<br />
Gece: gau<br />
Gün: egun<br />
&#8230;<br />
-de eki: -n, -an, -ean, -etan<br />
-lı/li eki: -ekin, -arekin<br />
ve: eta, ta<br />
eğer: ba, baldin ba<br />
çünkü: -elako, bait-</p>
<p>Baskça&#8217;nın asıl gizemli yanı ise Anadolu&#8217;da bundan 4 bin yıl önceye kadar, Hititler Hatti ülkesini ele geçirinceye kadar yaygın konuşulan Hatti diline çok benziyor oluşu.</p>
<p>İlker Fıçıcılar<br />
5 Ağustos 2010</p>
<p><em><strong>Yedeği:</strong> Bu yazının bir yedeği <a href="http://www.izedebiyat.com/yazi.asp?id=90225">http://www.izedebiyat.com/yazi.asp?id=90225</a> adresinde bulunabilir.</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/87/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/87/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/87/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/87/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/87/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/87/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/87/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/87/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=87&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2010/08/28/bask-dili/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
		<item>
		<title>Bubba Kiki Etkisi</title>
		<link>http://diluzerine.wordpress.com/2010/08/28/bubba-kiki-etkisi/</link>
		<comments>http://diluzerine.wordpress.com/2010/08/28/bubba-kiki-etkisi/#comments</comments>
		<pubDate>Sat, 28 Aug 2010 16:19:34 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[Anlambilim]]></category>
		<category><![CDATA[dil]]></category>
		<category><![CDATA[dilbilim]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=84</guid>
		<description><![CDATA[Testere sözcüğünü söylerken niçin diliniz testere dişi gibi hareket ediyor?... Peki ya balon derken neden ağzınız yuvarlak şekiller alıyor?...<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=84&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><img align="right" src="http://image.absoluteastronomy.com/images/encyclopediaimages/b/bo/booba-kiki.svg.png" alt="Bubba Kiki Etkisi" /><em>Testere sözcüğünü söylerken niçin diliniz testere dişi gibi hareket ediyor?&#8230; Peki ya balon derken neden ağzınız yuvarlak şekiller alıyor?&#8230;</em></p>
<p>Dilin (lisanın) evriminde şekillerle sesler arasındaki soyut bağa işaret eden bubba-kiki etkisi psikolog Wolfgang Köhler tarafından 1929&#8242;da keşfedilmiştir. İlkin Tenerife adasında yapılan psikolojik deneylerde, Köhler insanlara biri keskin, testere dişi gibi hatlara sahip olan, diğeri de yuvarlak hatlara, kıvrımlara sahip olan iki şekil göstermiştir; ve Tenerife adasındaki (modern dünyadan soyut bir ada) dile göre hangi şeklin &#8220;takete&#8221;  hangi şeklin de &#8220;baluba&#8221;  sözcüğünü işaret ettiğini sormuştur. Bulgular keskin hatlı şekil için &#8220;takete&#8221;, yuvarlak hatlı şekil için de &#8220;baluba&#8221; sözcüğünün %95-%98 gibi bir oranla yeğlendiğini göstermiştir.</p>
<p>2001&#8242;de aynı deney Vilayanur S. Ramachandran ile Edward Hubbard tarafından &#8220;kiki&#8221; ve &#8220;bouba&#8221; (&#8220;bubba&#8221;) sözcükleriyle İngilizce ve Tamilce konuşan denekler üzerinde yinelendi. Denekler %98 oranında kıvrımlı şekli &#8220;bubba&#8221;, testere dişli şekli de &#8220;kiki&#8221; sözcüğü ile ilişkilendirdiler.</p>
<p>Bu durum beynin bir biçimde sesler ve şekiller arasında soyut bağlar kurduğunu gösteriyor. Daphne Maurer ve ark.&#8217;nın yeni çalışması 2.5 yaşındaki çocukların dahi bu davranışı gösterdiğini ortaya çıkarmıştır.</p>
<p>Ramachandran ile Hubbard, kiki/bubba etkisinin dilin evrimi üzerine etkili olduğunu, çünkü bu deneyin nesnelerin adlandırılmasının tamamiyle rastlantısal olmadığını gösterdiğini ifade etmişlerdir. Yuvarlaklı şeklin genelde &#8220;bubba&#8221; diye adlandırıldığını, çünkü dudakların da yuvarlak halde çıkardığı sesin &#8220;bubba&#8221; sözüne yakın olduğunu, benzer şekilde &#8220;kiki&#8221; sesini çıkarırken ağız açılı ve gergin olduğu için bu şekille eşleştiğini belirtmişlerdir. Ayrıca &#8220;k&#8221; sesi &#8220;b&#8221; sesinden daha sert ve güçlüdür.</p>
<p>Seslerin rastlantısal-olmayan bir biçimde nesne ve olaylarla/anılarla ilişkilendirildiği sinestezya benzeri bu eşleşme, ses sembolizminin temelinin nörolojik olabileceğini göstermektedir.</p>
<p>İlker Fıçıcılar<br />
29.6.2009 </p>
<p><em><strong>Yedeği:</strong> Bu yazının bir yedeği <a href="http://www.izedebiyat.com/yazi.asp?id=90306">http://www.izedebiyat.com/yazi.asp?id=90306</a> adresinde bulunabilir.</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/84/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/84/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/84/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/84/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/84/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/84/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/84/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/84/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=84&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2010/08/28/bubba-kiki-etkisi/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>

		<media:content url="http://image.absoluteastronomy.com/images/encyclopediaimages/b/bo/booba-kiki.svg.png" medium="image">
			<media:title type="html">Bubba Kiki Etkisi</media:title>
		</media:content>
	</item>
		<item>
		<title>Sözlük Yazarının Dimağı</title>
		<link>http://diluzerine.wordpress.com/2010/07/01/sozluk-yazarinin-dimagi/</link>
		<comments>http://diluzerine.wordpress.com/2010/07/01/sozluk-yazarinin-dimagi/#comments</comments>
		<pubDate>Thu, 01 Jul 2010 17:41:19 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[doğru Türkçe]]></category>
		<category><![CDATA[sözlük]]></category>
		<category><![CDATA[Türkçe]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=80</guid>
		<description><![CDATA[Acaba ortaklaşa hazırlanan bir edebiyat, sanat, felsefe ve bilim sözlüğünün sözlük yazarlarının dimağında kaç sözcük var? Hani öyle ya, derler hani insan gün içinde 300&#8242;den fazla farklı sözcük kullanmaz diye. Bakalım, sözlük yazarları kaç sözcük biliyor ve gün içinde kullanıyormuş! Şimdi, linux işletim sisteminin bize sağladığı güzelliklerden yararlanarak sözlüğü sözcüklerine bölüyoruz önce. Noktalama işaretlerinden yalnızca [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=80&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Acaba ortaklaşa hazırlanan bir edebiyat, sanat, felsefe ve bilim sözlüğünün sözlük yazarlarının dimağında kaç sözcük var? Hani öyle ya,  derler hani insan gün içinde 300&#8242;den fazla farklı sözcük kullanmaz diye.</p>
<p>Bakalım, sözlük yazarları kaç sözcük biliyor ve gün içinde  kullanıyormuş!</p>
<p>Şimdi, linux işletim sisteminin bize sağladığı güzelliklerden  yararlanarak sözlüğü sözcüklerine bölüyoruz önce. Noktalama  işaretlerinden yalnızca kesme işaretini bırakarak geri kalan her  noktalamayı ve rakamları silerek yalnızca sözcükleri bırakacak şekilde,  regexp denen süzme yöntemiyle bir ayıklama yapıyoruz. Büyük harfleri  küçüklere dönüştürüyoruz. Sonra bunlardan yinelenen sözcükleri eliyor ve  bilgisayara saydırıyoruz elimizde kaç farklı sözcük biçimi var diye:</p>
<p>Sonuç: 397377</p>
<p>Yaklaşık 400 bin farklı sözcük biçimi kullanılmış sözlükte.</p>
<p>Yalnız bunlardan az da olsa bir kısmı, şarkı sözlerinden kalma  ingilizce sözcükler. Bir miktarı da özel ad. Eğer büyük harfleri  küçüklere dönüştürmeden sayarsak yaklaşık 430 bin sözcük sayıyor. Bu 30  bin farkın bir kısmı ise cümle başı sözcüklerinin ilk harfleri. Bir  cümle ortalama 13 sözcük. Sözlükte, 14 ayda birikmiş toplam 4 milyon kadar sözcük vardı.  Yani yaklaşık 300 bin tümce. Farklı sözcük sayımız toplamın yüzde 10  kadarı olduğuna göre 30 bin kadar ilk harfi büyük cümle başı sözcüğümüz  var. Elbette bunlar yaklaşık hesaplar. Az önceki büyük harf küçük harf  farklı sözcük sayıları arasındaki 30 binlik fark ile bu tahmini 30  binlik rakam bize özel isimlerin önemli bir yekün tutmadığını  gösteriyor. Öyleyse yaklaşık 400 bin farklı sözcük kullanılmış iddiamıza  devam edebiliriz.</p>
<p>Elbette bu 400 bin sözcük biçimi türkçe&#8217;nin eklemli bir dil  olmasından ötürü leksikal anlamda farklı sözcüklere işaret etmiyor.  Şimdi ortalama kaç sözcük formunun kullanıldığını anlamaya çalışalım.  Kimi sözcükler, özellikle de yüklemler epeyi biçime giriyor. Bir örnek:</p>
<p>Açabildi, açabildiği, açabileceği, açabileceğim, açabileceğimiz,  açabileceğini, açabilecek, açabilecekleri, açabilecekti,<br />
Açabilen, açabilenler<br />
Açabilir, açabilirdi, açabilirdim, açabilirim, açabilirken,  açabilirsin, açabilirsiniz, açabiliyor<br />
Açabilme, açabilmek, açabilmekle, açabilmektedir, açabilmektir<br />
Açabilmeli, açabilmeliler, açabilmenin, açabilmesi, açabilseydim</p>
<p>Eh.. Ben de &#8220;işin içinde çıkabilseydim&#8221; diyeyim bari. :)</p>
<p>İnat edelim gene de: Bu yukarıdaki örnekte değişmeyen tek kısım  grubundaki ilk 7 harf. &#8220;açabilen-&#8221; dışındakilerse fiil halleri. Toplam  iki anlam var yani bu 29 sözcük biçimi arasında. Bu arada &#8220;açık-&#8221; ile  başlayan 311 sözcük biçimi var. Ancak çoğu sözcük bu kadar biçimde değil  elbette. &#8220;amansız&#8221;, &#8220;amade&#8221;, &#8220;andaç(ı)&#8221;, &#8230; Genelde en çok i, e, de,  den halleri ve bunların çoğulları görülüyor. Yüklemlerse az önceki gibi  gayet çeşitlenebiliyor&#8230; Türkçe&#8217;de kökler isim yapan ek aldıktan sonra  genelde 5-6 harf uzunluğuna erişiyor. Yabancı dillerden gelen terimlerse  biraz daha uzun ancak az. Yine de bunlar da ilk 5-6 harfiyle ayırt  edilebiliyor. Bu şu demek: elimizdeki 400.000 sözcüğün ilk 6 harften  sonrasını kesip atarsak, ortalama olarak farklı anlama sahip sözcük  sayısını bulmaya yaklaşabiliyoruz. Deneyelim:</p>
<p>Sonuç: 133271 farklı leksikal grup.</p>
<p>Acaba bu çok mu fazla oldu! bir de ilk 5 harfi farklı olanları  sayalım:</p>
<p>Sonuç: 82425 farklı grup.</p>
<p>Her ikisi de günde 300 farklı sözcük kullanan insandan epeyi fazla.</p>
<p>Burada, bir internet sözlüğünde bir yazar, yaklaşık 100 bin farklı anlamda  sözcüğü gayet güzel bir şekilde kullanıyor gibi görünüyor. Sadece  okumuyor, dimağındaki bu sözcükleri yazıyor sivil sözlük yazarı.</p>
<p>E güzeeel.</p>
<p><em><strong>İlker Fıçıcılar</strong></em><br />
<em><strong>1 Temmuz 2010</strong></em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/80/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/80/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/80/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/80/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/80/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/80/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/80/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/80/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=80&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2010/07/01/sozluk-yazarinin-dimagi/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
		<item>
		<title>Çevrilebilir Yazı Yazmak</title>
		<link>http://diluzerine.wordpress.com/2009/02/04/cevrilebilir-yazi-yazmak/</link>
		<comments>http://diluzerine.wordpress.com/2009/02/04/cevrilebilir-yazi-yazmak/#comments</comments>
		<pubDate>Wed, 04 Feb 2009 12:22:33 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[doğru Türkçe]]></category>
		<category><![CDATA[Duru dil]]></category>
		<category><![CDATA[Makine Çevirisi]]></category>
		<category><![CDATA[bilgisayar çevirisi]]></category>
		<category><![CDATA[düzeltme]]></category>
		<category><![CDATA[gramer düzeltimi]]></category>
		<category><![CDATA[kontrollü dil]]></category>
		<category><![CDATA[redaksiyon]]></category>
		<category><![CDATA[yazı yazmak]]></category>
		<category><![CDATA[yazım denetimi]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=62</guid>
		<description><![CDATA[Yazılarımızı çok daha geniş bir hedef kitleye ulaştırmak için kontrollü bir dille yazı yazmak oldukça önemli. Şimdilerde giderek daha fazla oranda &#8216;makine çevirisi&#8217; kullanır olduk. Gerek Babil Türk sitesi yardımıyla olsun, gerek Google Translate yardımıyla olsun, çoğu yabancı dildeki siteyi anlayabiliyoruz artık. Aynı şekilde, bizim Türkçe yazdıklarımızı da yabancıların okuyabilmesi için, yazılarımızı BabilTurk ve Google&#8217;ın [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=62&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Yazılarımızı çok daha geniş bir hedef kitleye ulaştırmak için kontrollü bir dille yazı yazmak oldukça önemli.</p>
<p><span lang="tr-TR">Şimdilerde giderek daha fazla oranda &#8216;makine çevirisi&#8217; kullanır olduk. Gerek Babil Türk sitesi yardımıyla olsun, gerek Google Translate yardımıyla olsun, çoğu yabancı dildeki siteyi anlayabiliyoruz artık. Aynı şekilde, bizim Türkçe yazdıklarımızı da yabancıların okuyabilmesi için, yazılarımızı BabilTurk ve Google&#8217;ın doğru anlayıp çevirebileceği bir biçimde yazmamız önemli. Aksi halde bu makine tercümesi metinleri okumak zor olabilir.</span></p>
<p><span lang="tr-TR">İleride belki bu makine çevirileri çok daha kaliteli olacak, ama o an gelene kadar makine çevirisi kalitesini arttırmak için yapabileceğiniz bazı şeyler var.</span></p>
<p><span lang="tr-TR">Düşünce basit: &#8216;duru dil&#8217; / &#8216;kontrollü dil&#8217; denen yazı yazma ipuçlarını kullanarak yanlış çevirileri ve garip cümlelerden oluşmuş sonuçları epeyce azaltabilirsiniz.</span></p>
<p><span lang="tr-TR">Peki &#8216;duru dil&#8217; ile ne demek istiyoruz? Aslında bir yazarın yazısına düşünce çorbası değil de hassas bir aletmişçesine yaklaşmasıdır sadece. İyi teknik yazarlar zaten böyle yöntemler kullanırlar: yazılarını standartlaştırır, basitleştirir, düzeltir ve kısaltırlar.</span></p>
<p><span lang="tr-TR">Açıkçası, her dil kendine özgü bir dizi kurala gerek duyar. Ancak, yine de çoğu dünya dili için geçerli olan çekirdek bir kurallar dizisi de vardır&#8230;</span></p>
<p> </p>
<ol>
<li><span lang="tr-TR">İmlânızın doğru olduğundan emin olun. Örneğin <a title="Babil Türk Online Makine Çevirisi Sitesi" href="http://www.babilturk.com/" target="_blank">Babil Türk</a> online bir yazım denetimi aracı sunuyor. Benzer şekilde OpenOffice veya MS Word de F7 tuşu ile çalışan yazım düzeltme özelliğine sahipler.</span></li>
<li><span lang="tr-TR">Sade bir dil kullanın. Örneğin &#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> arabayı sürün</span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> motorlu aracın götürgecini tepikleyin</span></span></p></blockquote>
<li><span lang="tr-TR">Yaklaşık 	25 veya daha az sözcükten oluşan kısa cümleler kurun.</span></li>
<li><span lang="tr-TR">Her tümce yalnızca bir kavram açıklasın. Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Açık ve sade yazmak makine çevirisini daha güvenilir yapar. Güvenilir bir çeviri daha kolay anlaşılır olacaktır. </span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Açık ve sade yazış makine tercümesini daha güvenilir kılar ve haliyle bu daha kolay anlaşılır olacaktır.</span></span></p></blockquote>
<li><span lang="tr-TR">Yazarken, 	düzgün  ve tamamlanmış, tam tümceler kurun. Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Kahvenize süt tozu da ister misiniz? </span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Süt tozu?</span></span></p></blockquote>
<li><span lang="tr-TR">Benzer düşünceleri anlatırken tutarlı bir dil kullanın. Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Yağmurluyken, işe araba ile giderim. Güneşliyken, işe bisiklet ile giderim.</span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Yağmurluyken, işe araba ile giderim. Güneş ışıldarkense, velespitimle varırım işime.</span></span></p></blockquote>
<li><span lang="tr-TR">Zamirleri kullanmaktansa isimleri tekrarlayın. Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Mektubu göndermeden önce </span><span lang="tr-TR"><em>mektuba</em></span><span lang="tr-TR"> bir pul yapıştırın.</span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Mektubu göndermeden önce </span><span lang="tr-TR"><em>ona</em></span><span lang="tr-TR"> bir pul yapıştırın.</span></span></p></blockquote>
<li><span lang="tr-TR">Pasif, edilgen, devrik tümce biçimleri yerine, aktif tümceler kurun. 	Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Babam size bir bayram kartpostalı yollayacak.</span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Bir bayram kartpostalı size yollanacak.</span></span></p></blockquote>
<li><span lang="tr-TR">İsimleri belirtmek için &#8220;bu&#8221;, &#8220;şu&#8221;, &#8220;o&#8221;, 	&#8220;böyle&#8221;&#8230; gibi gösterme sıfatlarını kullanın. Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Bu arabayı alın.</span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Arabayı alın.</span></span></p></blockquote>
<li><span lang="tr-TR">Karman çorman bir biçimde yazmayın! Cümlelerinizi mantıklı, aşamalı bir biçimde oluşturun. Örneğin&#8230;</span></li>
<blockquote><p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Doğrusu:</strong></span><span lang="tr-TR"> Halınızı temizleyip tozlarını almak için bir elektrikli süpürge kullanın. </span></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>Yanlışı:</strong></span><span lang="tr-TR"> Bir elektrikli süpürgeden yararlanarak, ki halı temiz olsun diye, tozları üstünden çekebilirsiniz. (Hmmmm. Halı süpürülecek yani&#8230;)</span></span></p></blockquote>
<p> </p>
<p><span lang="tr-TR">Lütfen bunların yalnızca kılavuz amaçlı olduğunu hatırda tutun: Bu tür katı kurallar kimi yazı tarzları için uygun değildir. Örneğin edebiyat, tekdüze bir yazı tarzı sevmez. Bunlar şiire veya yaratıcı reklam metinlerine de uygulanamaz. Ama zaten bu tür metinleri de gerçek çevirmenlere çevirtmek gerekir, makinelere değil.</span></p>
<p><span lang="tr-TR">Dolayısıyla, &#8220;duru dil&#8221;, &#8220;kontrollü dil&#8221; özellikle teknik yazılarda çok işe yarar. Örneğin bir web günlüğü yazısına, teknik bir açıklamaya veya çabuk tüketilecek teknoloji haberlerine oldukça uygundur.</span></p>
<p><span lang="tr-TR">Bu önerileri akıldan çıkarmadan, seçici olmak kaydıyla çok başarılı makine çevirisi sonuçları elde edebilir, yazdıklarınızı Türkçe bilmeyen dünyanın geri kalanına da doğru bir biçimde ulaştırabilirsiniz.</span></p>
<p> </p>
<p><span lang="tr-TR"><em>Bu yazı aşağıda kaynak kısmında belirtilen &#8220;Writing for translation&#8221; adlı yazının genişletilmiş ve ülkemize uyarlanmış bir çevirisidir.</em></span></p>
<p><span style="font-size:x-small;"><span lang="tr-TR"><strong>İlker Fıçıcılar<br />
</strong></span><span lang="tr-TR">4 Şubat 2008</span></span></p>
<p> </p>
<p><span lang="tr-TR"><strong>Kaynak:</strong></span></p>
<div>
<ul>
<li>“Writing for translation”, Mloovi Blog, 4 Şubat 2009,<a href="http://blog.mloovi.com/2008/12/writing-for-translation/">http://blog.mloovi.com/2008/12/writing-for-translation/</a></li>
</ul>
</div>
<p><strong><span lang="tr-TR">Ek bilgi</span></strong></p>
<div>
<ul>
<li>“Controlled Language for machine translation”, Uwe Muegge, 4 Şubat 2009, <a href="http://www.muegge.cc/controlled-language.htm">http://www.muegge.cc/controlled-language.htm</a></li>
<li>“Babil Türk”, <a title="Online Türkçe İngilizce Makine Çevirisi" href="http://www.babilturk.com/">http://www.babilturk.com/</a></li>
<li> “Google Translate”, http://translate.google.com/ </li>
<li>“Dil Üzerine Yazılar”, http://diluzerine.wordpress.com/  </li>
<li>&#8220;Çevrilebilir Yazı Yazmak&#8221;, <a href="http://diluzerine.wordpress.com/2009/02/04/cevrilebilir-yazi-yazmak/">http://diluzerine.wordpress.com/2009/02/04/cevrilebilir-yazi-yazmak/</a></li>
</ul>
<p> </p></div>
<p>&#8211;</ol>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/62/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/62/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/62/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/62/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/62/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/62/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/62/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/62/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=62&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2009/02/04/cevrilebilir-yazi-yazmak/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
		<item>
		<title>Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir</title>
		<link>http://diluzerine.wordpress.com/2008/10/30/her-karmasik-ifade-daha-az-karmasik-ifadelerin-birlesimi-ile-ifade-edilebilir/</link>
		<comments>http://diluzerine.wordpress.com/2008/10/30/her-karmasik-ifade-daha-az-karmasik-ifadelerin-birlesimi-ile-ifade-edilebilir/#comments</comments>
		<pubDate>Thu, 30 Oct 2008 16:13:21 +0000</pubDate>
		<dc:creator>dilmac</dc:creator>
				<category><![CDATA[Anlambilim]]></category>
		<category><![CDATA[Makine Çevirisi]]></category>

		<guid isPermaLink="false">http://diluzerine.wordpress.com/?p=55</guid>
		<description><![CDATA[Anlam Bilim Dilleri ve Anlambilim Dili Çözümleme Üzerine Düşünceler &#8211; 1 İlker Fıçıcılar 30 Ekim 2008 1. Önerme: Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir. karmaşık ifade = ifade 1 (işlem) ifade2 [ (işlem) ifade 3 ... ] örnek: &#8220;Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir.&#8221; olgu-1 [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=55&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><strong>Anlam Bilim Dilleri ve Anlambilim Dili Çözümleme Üzerine Düşünceler &#8211; 1</strong></p>
<p><em><strong>İlker Fıçıcılar<br />
<em>30 Ekim 2008</em></strong></em></p>
<p><strong>1. Önerme:</strong> Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir.</p>
<p>karmaşık ifade = ifade 1 (işlem) ifade2 [ (işlem) ifade 3 ... ]</p>
<p>örnek: &#8220;Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir.&#8221;</p>
<p>olgu-1 = her karmaşık ifade = tümlemi( karmaşık (ifade) )</p>
<p>olgu-2 = olgu-1 anlatılabilir =  anlatmak kapsar olgu-1</p>
<p>olgu-3 = olgu-1 &#8211; daha_az(karmaşık)</p>
<p>olgu-4 = tümlemi(olgu-3)</p>
<p>olgu-5 = olgu-4 anlatir olgu-1</p>
<p>Bu olgular super-set bir anlambilim dili ile ifade edildiğinde, örnekte verilen cümleyi harhangi bir başka dilde anlambilim-çözücü bir algoritma ile yeniden ifade etmek mümkün olacaktır.</p>
<p>Anlambilim-çözücüden kasıt, şu örnek ifade-etme ve yeniden ifade-etme ile görülebilir:</p>
<p>Türkçe cümle: &#8220;Bir kadın insandır.&#8221;</p>
<p>olguluk-1: kadın tanımlanacak</p>
<p>olguluk-2: kadın sayılabilir bir kavram</p>
<p>olguluk-3: insan üst kümesi kadın alt-kümesini kapsıyor</p>
<p>Bunu DRS anlambilim dili ile yazarsak:</p>
<p>[A, B, C]<br />
object(A, kadın, sayılabilir, na, eq, 1)-1<br />
object(B, insan, sayılabilir, na, eq, 1)-1<br />
predicate(C, eşittir, A, B)-1</p>
<p>Veya OWL anlambilim dili ile:</p>
<p>Ontology(<br />
ClassAssertion(<br />
Class(:kadın)      AnonymousIndividual(1)   )<br />
ClassAssertion(      Class(:human)      AnonymousIndividual(2)   )<br />
SameIndividual(      AnonymousIndividual(1)      AnonymousIndividual(2)   ))</p>
<p>Veya OWL RDF ile:</p>
<p>&lt;?xml version=&#8221;1.0&#8243; encoding=&#8221;UTF-8&#8243;?&gt;<br />
&lt;rdf:RDF<br />
xmlns:owl=&#8221;http://www.w3.org/2002/07/owl#&#8221;<br />
xmlns:owl11=&#8221;http://www.w3.org/2006/12/owl11#&#8221;<br />
xmlns:swrl=&#8221;http://www.w3.org/2003/11/swrl#&#8221;<br />
xmlns:swrlb=&#8221;http://www.w3.org/2003/11/swrlb#&#8221;<br />
xmlns:rdf=&#8221;http://www.w3.org/1999/02/22-rdf-syntax-ns#&#8221;<br />
xmlns:rdfs=&#8221;http://www.w3.org/2000/01/rdf-schema#&#8221;&gt;<br />
&lt;owl:Ontology rdf:about=&#8221;"/&gt;<br />
&lt;owl:Thing rdf:nodeID=&#8221;id1&#8243;&gt;<br />
&lt;rdf:type&gt;      &lt;owl:Class rdf:about=&#8221;#kadın&#8221;/&gt;    &lt;/rdf:type&gt;  &lt;/owl:Thing&gt;<br />
&lt;owl:Thing rdf:nodeID=&#8221;id2&#8243;&gt;<br />
&lt;rdf:type&gt;      &lt;owl:Class rdf:about=&#8221;#insan&#8221;/&gt;    &lt;/rdf:type&gt;  &lt;/owl:Thing&gt;  &lt;owl:Thing rdf:nodeID=&#8221;id1&#8243;&gt;<br />
&lt;owl:sameAs rdf:nodeID=&#8221;id2&#8243;/&gt;  &lt;/owl:Thing&gt;&lt;/rdf:RDF&gt;</p>
<p>Tabii günümüzdeki bu anlambilim dilleri henüz bir süper-set olmaktan uzak. Yine de gidilecek yola ilişkin fikir veriyorlar.</p>
<p>Bu diller, WordNet gibi bir veritabanı ile ilişkilendirildikten sonra her dilde yeniden ifade-etme işlemlerinde kullanılabilirler.</p>
<p>Söze-dökme diyebileceğimiz bu işlem için her dile özgü bir çözücü yazılmalıdır.</p>
<p>Bu anlambilim dillerinde fiiller dilin içine gömülü olduğundan genellikle bir tek isimlerin sözcük karşılıklarına bakmak kalıyor.</p>
<p>Örneğin yukarıdaki OWL dilindeki metin dillere de ilgili dilin çözücüsü ile aktarılacaktır:</p>
<p><span id="more-55"></span></p>
<p>Fransızca: Une cevirisi(kadın) est l&#8217;cevirisi(insan).</p>
<p>İngilizce: A cevirisi(kadın) is a cevirisi(insan).</p>
<p>Macarca: Az cevirisi(kadın) egy cevirisi(insan).</p>
<p>&#8230; gibi.</p>
<p>Tabii bu OWL gibi anlambilim dillerine anlam-belirsizliği sızmamalı. Bir isim için birden çok karşı dil eşlemesine izin vermemek için WordNet, BalkaNet gibi geniş lexicon veritabanları bu OWL gibi dillerle bütünleştirilmeli.</p>
<p>Bu örnekleri, ifadecikleri bunlarla anlatabileceğimizi söylemek için vermiştik. Asıl önermemiz karmaşık ifadelerin daha alt ifadelere bölünebileceği idi. Ancak bu alt ifadecikleri bir biçimde birleştirmemiz gerekli. Bunun için de kullandığımız ister First Order Logic olsun, ister OWL olsun bu ontoloji/anlambilim dilinin iç içe ifadelere izin vermesi veya başka ifadelere üst-ifade-işlemleri ile ilişkilendirmeye izin vermesi gerekir.</p>
<p>Bu arada veri sıkıştırmaya bir örnek olması için yukarıdaki &#8220;bir kadın bir insandır&#8221; cümlesini nasıl sıkıştırabileceğimizi yazalım:</p>
<p>&#8220;tanımlama&#8221; işleminin 8 bitlik 16&#8242;lık sayı sistemindeki kodu 21 olsun mesela, ve sonra gelenler değişken olsun, 00 ile liste bitsin:</p>
<p>Bu durumda DRS dilindeki</p>
<p>[A, B, C]<br />
yeni makine dili ontoloji kodumuz olarak şu oluyor:</p>
<p>21 01 02 03 00</p>
<p>Devam edelim. Nesne tanımlama kodu 42 olsun, 8 bitlik bir flag parametresi olsun, 1 baytlık bir değişken kodu ve 4 baytlık bir lexicon kodu olsun:</p>
<p>Bu durumda da DRS dilindeki</p>
<p>object(A, kadın, sayılabilir, na, eq, 1)-1</p>
<p>şuna dönüşür:</p>
<p>42 0F 01 98 76 54 32</p>
<p>ve<br />
object(B, insan, sayılabilir, na, eq, 1)-1</p>
<p>de şuna:</p>
<p>42 0F 02 01 23 45 67</p>
<p>Son olarak koşul ifademizin kodu da 63 olsun, değişken kodu paremetresi olsun, ve sırayla ilişkilendirme değişkenlerini paremetre olarak alsın, ve iki baylık da bir fiil lexiconu olsun; &#8220;eşittir&#8221;, &#8220;olmak&#8221;, &#8220;be/is&#8221;, &#8220;est&#8221; anlamındaki örnek lexiconun kodu da 92 61 olsun:</p>
<p>böylece<br />
predicate(C, eşittir, A, B)-1</p>
<p>DRS satırı şu olur:</p>
<p>63 03 01 02 92 61</p>
<p>Hepsini yazarsak:</p>
<p>21 01 02 03 00</p>
<p>42 0F 01 98 76 54 32</p>
<p>42 0F 02 01 23 45 67</p>
<p>63 03 01 02 92 61</p>
<p>Evet, nihayet! Yeni uydurduğumuz bir makine dilinde &#8220;bir kadın bir insandır&#8221; diyebiliyoruz, ve bunu bir makine anlayabiliyor!..</p>
<p>Bakalım kaç byte tuttu:</p>
<p>ana tanımlama: 5 byte (olmasa da olur; bunu DRS&#8217;ye uysun diye koymuştuk.)</p>
<p>kadını tanımlama: 7 byte</p>
<p>insanı tanımlama: 7 byte</p>
<p>bu iki tanımı ilişkilendirme: 6 byte</p>
<p>Toplam: 25 byte (ya da gereksiz kısım hariç 20 byte)</p>
<p>Gayet iyi.</p>
<p>Örnek cümle Türkçede 22 byte tutuyordu. Gerçi İngilizcesi 17 byte tutuyor ama olsun. Daha uzun sözcüklerde bile bizim makine dilimiz 20 byte tutacak. Örneğin, &#8220;bir Çekoslavakyalılaştıramadığımız da bir insandır&#8221; cümlesi de makine dilinde</p>
<p>42 0F 01 87 65 43 21 42 0F 02 01 23 45 67 63 03 01 02 92 61</p>
<p>dizisiyle kısa ve öz bir biçimde ifade edilebilir. Üstelik bir anlambilim-çözücü bu makine dilindeki ifadeyi alıp gelmiş gelecek tüm dillere çevirebilecektir.</p>
<p><em><strong>İlker Fıçıcılar</strong><br />
30 Ekim 2008</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/diluzerine.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/diluzerine.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/diluzerine.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/diluzerine.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/diluzerine.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/diluzerine.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/diluzerine.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/diluzerine.wordpress.com/55/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=diluzerine.wordpress.com&amp;blog=4155109&amp;post=55&amp;subd=diluzerine&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://diluzerine.wordpress.com/2008/10/30/her-karmasik-ifade-daha-az-karmasik-ifadelerin-birlesimi-ile-ifade-edilebilir/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">dilmac</media:title>
		</media:content>
	</item>
	</channel>
</rss>
