Feeds:
Yazılar
Yorumlar

Archive for the ‘Anlambilim’ Category

Sinestezya

Ünlü bilim adamlarının, ünlü bestecilerin ve diğer sanatçıların bir kısmında sinestezya vardır.

Sinestezya Yunanca “aynı anda” “birlikte” anlamına gelen sin (Sigma Upsilon Nu) öneki ile “duyu” anlamına gelen estezis kökünün birleşiminden türemiş bir sözcüktür. Sinirbilimsel bir rahatsızlığı tanımlar. Algılanan bir duyunun diğer duyu organlarından hissedilecekleri tetiklemesi anlamındadır.

En sık görülen türü seslerin sinestetik kişinin zihninde renk cümbüşü yaratması şeklindedir.

Bir başka yaygın türünde bilişsel, dilbilimsel işlevler renkler ve şekillerle ‘istemdışı’ ilişkilenir. Bu renk ve şekil sinestezyasında rakamlar, tek tek harfler, hatta ay, yıl, gün gibi kavramlar zihinde kendiliğinden renklenir. Örneğin ünlü fizikçi Richard Feynman da bir sinestetiktir ve bir otobiyografisinde deneyimlerini paylaşmıştır.

Yalnız bu sinestezya sanatsal metafor kullanımıyla karıştırılmamalıdır. Her ne kadar ünlü bestecilerin, ve diğer sanatçıların bir kısmında sinestezya var idiyse de, sinestezi tamamiyle istemdışıdır; nörolojik bir hastalıktır.

LSD, Meskalin gibi halüsinojen kimi maddelerin de benzer bir deneyim yaşattığı bilinmektedir. Ayrıca kimi körlük ve sağırlık vakaları ile geçmişte yapılmış lobotomi deneylerinde de gözlenmiştir.

Sinestezya, asosyalliğe yol açan, nörolojik bir rahatsızlık olsa da genellikle çok harika bir yan etkiye sahiptir: güçlü bir bellek ve yaratıcılık.

Sinestetik kişiler belli sesler için, mesela genellikle yüksek frekanslar için daha açık renkler gördüklerinden, benzer sesleri zihinlerinde aynı renkle gruplarlar. Gene kimi isimler de kendiliğinden bir renk ile çağrışır ve o kişiler o renk gruplarıyla birlikte anımsanır. Bu gruplama ve sınıflandırma belleğin çağrışım gücünü arttıran bir tekniktir, ve sinestetiklerde bu kendi kendiliğine olmaktadır.

Sinestezya sık görülen bir rahatsızlıktır. Yaklaşık her 23 kişiden 1’inde hafif de olsa bir sinestezi görülür. Yaklaşık 90’da 1 oranında da şekilli renk sinestezisine rastlanır.

İlginç olansa çoğu sinestetik, öyle olduklarını pek fark etmez. Ancak diğer insanların kendileri gibi ‘şeyler’ hissetmediklerini anladıklarında farklı olduklarını ayırt edip genellikle bunu saklarlar. Hatta gizli bir güç, 6. His gibi algılayıp keyfini sürerler. Bu kişiler bu özelliklerini keşfedip kendi yararlarına kullanmayı öğrendikçe, fırsat bulurlarsa genellikle bilim ve sanat gibi yaratıcı alanlara yönelmektedirler.

Ünlü sinestetikler arasında ressam Wassily Kandinsky, yazar Vladimir Nabokov, besteci Duke Ellington, Franz Liszt, Nikolai Rimsky Korsakov, fizikçi Richard Feynman ve şair Arthur Rimbaud ile Charles Baudelaire de vardır.

İlker Fıçıcılar

Anahtar sözcükler: sinestezi, bilim, sanat, sinestezya

Referans bilgisi: “Sinestezya”, 2009 , Bilim Bilmek sitesi, http://www.bilimbilmek.com/tr/sinestezya.html

Reklamlar

Read Full Post »

EC Tercüme Bürosu’nun Şip Şak Çeviri diye bir sitesi var. Adresi: http://www.sipsakceviri.com/

Dil üzerine epeyi bir site inceleme fırsatım olduğu için rahatlıkla söyleyebilirim ki Türkiye’de bir eşi daha yok… Doğal dil algoritmaları, makinelerin insanları anlaması, anlambilim gibi alanlarda uğraştığımdan dil ile ilgili çeşitli tercüme siteleri, üniversitelerin yayın sayfaları, mt-archive.info gibi yerlere girip çıkmam gerekiyor. Ve gördüğüm kadarıyla EC Tercüme’ye az da olsa benzerbir firma Londra’da var, ve birkaç da ABD’de, hepsi o.

Peki farklı olan ne?.. Söyleyeyim: Yapay Zeka

Şip Şak Çeviri’de belli ki yapay zeka ve ileri programlama kullanılmış.

Öncelikle Türkiye’de başka hiçbir tercüme bürosunda öyle dosyayı yükleyeyim de hemen çeviri başlansın gibi bir hizmet yok… EC Tercüme gönderilen dosyanın ne olduğunu otomatik anlama işini başarmış.

Çalışma sistemi şöyle: Çevrilecek bir dosyanız var, belki ticari bir mektup belki bir akademik makale, belki bir ödev ya da belki bir CV… Bu dosyayı sitedeki ilgili formu kullanarak yüklüyorsunuz. Ve size bir fiyat ve süre verip soruyor: Çeviriye başlansın mı?

E ne var bunda değil mi?.. Şu var:

– Gönderdiğiniz dosyanın tipini anlıyor: PDF mi, DOC mu ne?.. E hadi bu da basit diyelim.

– Eğer bir sayfa taramış ve JPG olarak yüklemişseniz bunu düz yazıya dönüştürüp öyle yokluyor!… Hımm bu biraz zor işte… Başka?

– Gönderdiğiniz dosyanın dilini anlıyor!.. Nasıl yani değil mi?

Kategorisini anlıyor!.. İşte bu da yukarıdaki gibi yapay zeka konularından. Burada olasılıkla bir classifier algoritması, Bayesian öğrenme algoritması gibi bir teknik kullanılmış.

– Sizi anımsıyor ve daha önce gönderdiğiniz konuya benzer konu ise indirim uyguluyor!!.. Hımm bunda da yukardaki gibi bir benzerlik bulma yöntemi, veya çok boyutlu vektör uzayı modellemesi kullanılmış olmalı… Giderek yüksek matematiğe el attılar farkındaysanız.

– Konuya en uygun çevirmen tahsisi yapılıyor… Gene benzer bir sınıflandırmaya ek olarak kaynak tahsis algoritması kullanılabilir.

– İmla hataları saptanıyor ve metin ne kadar hatasızsa o oranda indirim uygulanıyor!.. Hadi bunu basit bir veritabanı yoklaması ile yapabilirler diyeceğim, ama Türkçe sözcükler ekleriyle birlikte milyonlarca farklı şekle bürünüyor… Zemberek gibi açık kaynak kodlu yazım denetimi kodları da yavaş. Yüklenen dosyayı saniyesinde işlemden geçirdiğini düşünürsek burada bir sihir var diyebiliriz.

– Bir de metin zorluğu hesaplıyormuş. Bunu ise klasik bir istatistik sayımla yapıyor olabilirler. Ya da Dale Chall gibi ilköğretim çocuklarına uygun metin seçmede kullanılan çeşitli hesaplamalar var. Ama Türkçe için yok. Belki onlar kullanılıyordur… Ama metin ne kadar kolaysa, o kadar indirim deniyor, ve metnin kolaylığını zorluğunu bilgisayar saptıyor ki işte bu da yapay zeka konusu aslında.

Güzel oluyor bu tür ileri teknolojileri Türkiye’de görmek…

Geriye bir tek EC Tercüme Bürosu‘nun bu Şip Şak İngilizce Türkçe Çeviri sitesinin konuşması kalmış, utanmasa “Kahve ister misiniz çeviri yapılırken?” diyecek! :)

Read Full Post »

Patlayan Bilgisayar KarikatürüEski bir fıkradır:

Bir süperbilgisayar yapılmıştır, ne sorulsa yanıtlamaktadır… Her ülkeden bilim adamları gelir, bir şeyler sorar ve başarıyla yanıt alırlar bilgisayardan; ve bravo der çekilirler… Ve evet, sıra bize, bizim Temel’e gelir :)

Ve Temel bilgisayara sorar:

Ne var ne yok?

***

Ve bu soruyu bir deyim olarak algılamayan bilgisayar, bilgi saymaya, evrende var olan ve var olmayan her şeyi saymaya başlar…

Sayar… sayar… sayar… Ve dumanlar çıkararak patlar :)

***

Doğal dil ile çalışan, İngilizce ve Türkçe anlayan yanıt motoru Didikle de patlıyor!..

http://m.didikle.com/ adresine Firefox ile girip, Türkçe olarak

ne var ne yok?

diye sorarsanız :)

not: Didikle’de başka sürpriz yumurtalar da var! Keşfetmekse eğlenceli :)


[Sip Sak Ceviri]

Read Full Post »

Karışık göründüğüne bakmayın… Anlattığımı yapması, buraya yazmasından daha kolay… Dikkatini verip iyice inceleyenler, çok çok sürpriz uygulama sahalarını da fark edecekler yöntemin ;) bir sır…

Web sitenize yüklenen bir makalenin özgün olup olmadığını, ya da sizin sitenizdeki makaleleri aşıranların kimler olduğunu otomatik olarak saptamanın bir yolu var.

Vektör Uzayı Modeli denen yöntemle makalelerin birbirlerine benzerliklerini karşılaştırabilirsiniz.

Bu yöntem şu şekilde kullanılıyor:

Önce makalelerin farklılıklarını temsil edebilecek bir sözcük listesi oluşturuyoruz. Bu liste, bir makalede sık geçen ama makaleler arasında az geçen sözcüklerden seçilerek oluşturuluyor. Sonra bu listeyi bir dizine alıyoruz, ve listedeki her bir sözcüğü sanki çok boyutlu bir vektörün değişkeni imişçesine işliyoruz. Bir makaledeki bu listede olan sözcüklerin görülme sıklıklarının 0-1 normalizasyonu bizim vektörümüzün katsayıları olacak.

Örneğin listemizde “fizik” sözcüğü varsa, ve 321 sözcüklük bir makalede 12 kez “fizik” geçiyorsa katsayımız: 12/321=0.0373831 olacak. Elimizdeki her makale için oluşturduğumuz listede bulunan sözcükler varsa bu katsayıları hesaplayıp bir dizine alıyoruz. Bu bizim çok boyutlu vektörümüz.

Malum, vektörler yön gösterir. Ok şekliyle ifade ederiz fizikte, matematikte zaten. İşte bu vektörleri elde ettikten sonra aynı yönü işaret edip etmediklerine bakıyoruz, aynı yöne doğru bakan vektörlerin temsil ettikleri makaleler benzerdir. Benzerlik oranı, iki vektörün arasındaki açıyla orantılı.

İki vektör arasındaki açıyı ise bu iki vektörün nokta çarpımını, vektörlerin determinantlarının çarpımına bölerek bulabiliriz. Bu bölüm bize açının kosinüsünü verecektir. Yani tam olarak aynı noktaya bakıyorlarsa 1, ortogonallerse, dik açı yapıyorlarsa 0 değerini alacağız.

Matematik ifadesi:

cos(açı) = vektör1 . vektör2 / (det(vektör1)*det(vektör2))

Örneğin vektör1, özgün olup olmadığını merak ettiğimiz makalenin vektörü olsun, vektör2’ler de sırayla daha önce web sitemize yüklenmiş makalelerin vektörleri olsun tek tek.

Ya da vektör1 sizin rakibiniz bir web sitesine yeni yüklenmiş bir makalenin vektörü, vektör2’ler de sırayla sizin sitenizdeki makalelerin vektörleri olabilir. Böylece rakip site sizden makale aşırdıysa bunu hemen anlayabilirsiniz.

Yapması anlatmasından daha kolay. Örnekliyorum:

(daha&helliip;)

Read Full Post »

Bubba Kiki Etkisi

Bubba Kiki EtkisiTestere sözcüğünü söylerken niçin diliniz testere dişi gibi hareket ediyor?… Peki ya balon derken neden ağzınız yuvarlak şekiller alıyor?…

Dilin (lisanın) evriminde şekillerle sesler arasındaki soyut bağa işaret eden bubba-kiki etkisi psikolog Wolfgang Köhler tarafından 1929’da keşfedilmiştir. İlkin Tenerife adasında yapılan psikolojik deneylerde, Köhler insanlara biri keskin, testere dişi gibi hatlara sahip olan, diğeri de yuvarlak hatlara, kıvrımlara sahip olan iki şekil göstermiştir; ve Tenerife adasındaki (modern dünyadan soyut bir ada) dile göre hangi şeklin “takete” hangi şeklin de “baluba” sözcüğünü işaret ettiğini sormuştur. Bulgular keskin hatlı şekil için “takete”, yuvarlak hatlı şekil için de “baluba” sözcüğünün %95-%98 gibi bir oranla yeğlendiğini göstermiştir.

2001’de aynı deney Vilayanur S. Ramachandran ile Edward Hubbard tarafından “kiki” ve “bouba” (“bubba”) sözcükleriyle İngilizce ve Tamilce konuşan denekler üzerinde yinelendi. Denekler %98 oranında kıvrımlı şekli “bubba”, testere dişli şekli de “kiki” sözcüğü ile ilişkilendirdiler.

Bu durum beynin bir biçimde sesler ve şekiller arasında soyut bağlar kurduğunu gösteriyor. Daphne Maurer ve ark.’nın yeni çalışması 2.5 yaşındaki çocukların dahi bu davranışı gösterdiğini ortaya çıkarmıştır.

Ramachandran ile Hubbard, kiki/bubba etkisinin dilin evrimi üzerine etkili olduğunu, çünkü bu deneyin nesnelerin adlandırılmasının tamamiyle rastlantısal olmadığını gösterdiğini ifade etmişlerdir. Yuvarlaklı şeklin genelde “bubba” diye adlandırıldığını, çünkü dudakların da yuvarlak halde çıkardığı sesin “bubba” sözüne yakın olduğunu, benzer şekilde “kiki” sesini çıkarırken ağız açılı ve gergin olduğu için bu şekille eşleştiğini belirtmişlerdir. Ayrıca “k” sesi “b” sesinden daha sert ve güçlüdür.

Seslerin rastlantısal-olmayan bir biçimde nesne ve olaylarla/anılarla ilişkilendirildiği sinestezya benzeri bu eşleşme, ses sembolizminin temelinin nörolojik olabileceğini göstermektedir.

İlker Fıçıcılar
29.6.2009

Yedeği: Bu yazının bir yedeği http://www.izedebiyat.com/yazi.asp?id=90306 adresinde bulunabilir.

Read Full Post »

Anlam Bilim Dilleri ve Anlambilim Dili Çözümleme Üzerine Düşünceler – 1

İlker Fıçıcılar
30 Ekim 2008

1. Önerme: Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir.

karmaşık ifade = ifade 1 (işlem) ifade2 [ (işlem) ifade 3 … ]

örnek: “Her karmaşık ifade daha az karmaşık ifadelerin birleşimi ile ifade edilebilir.”

olgu-1 = her karmaşık ifade = tümlemi( karmaşık (ifade) )

olgu-2 = olgu-1 anlatılabilir =  anlatmak kapsar olgu-1

olgu-3 = olgu-1 – daha_az(karmaşık)

olgu-4 = tümlemi(olgu-3)

olgu-5 = olgu-4 anlatir olgu-1

Bu olgular super-set bir anlambilim dili ile ifade edildiğinde, örnekte verilen cümleyi harhangi bir başka dilde anlambilim-çözücü bir algoritma ile yeniden ifade etmek mümkün olacaktır.

Anlambilim-çözücüden kasıt, şu örnek ifade-etme ve yeniden ifade-etme ile görülebilir:

Türkçe cümle: “Bir kadın insandır.”

olguluk-1: kadın tanımlanacak

olguluk-2: kadın sayılabilir bir kavram

olguluk-3: insan üst kümesi kadın alt-kümesini kapsıyor

Bunu DRS anlambilim dili ile yazarsak:

[A, B, C]
object(A, kadın, sayılabilir, na, eq, 1)-1
object(B, insan, sayılabilir, na, eq, 1)-1
predicate(C, eşittir, A, B)-1

Veya OWL anlambilim dili ile:

Ontology(
ClassAssertion(
Class(:kadın)      AnonymousIndividual(1)   )
ClassAssertion(      Class(:human)      AnonymousIndividual(2)   )
SameIndividual(      AnonymousIndividual(1)      AnonymousIndividual(2)   ))

Veya OWL RDF ile:

<?xml version=”1.0″ encoding=”UTF-8″?>
<rdf:RDF
xmlns:owl=”http://www.w3.org/2002/07/owl#&#8221;
xmlns:owl11=”http://www.w3.org/2006/12/owl11#&#8221;
xmlns:swrl=”http://www.w3.org/2003/11/swrl#&#8221;
xmlns:swrlb=”http://www.w3.org/2003/11/swrlb#&#8221;
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#&#8221;
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”&gt;
<owl:Ontology rdf:about=””/>
<owl:Thing rdf:nodeID=”id1″>
<rdf:type>      <owl:Class rdf:about=”#kadın”/>    </rdf:type>  </owl:Thing>
<owl:Thing rdf:nodeID=”id2″>
<rdf:type>      <owl:Class rdf:about=”#insan”/>    </rdf:type>  </owl:Thing>  <owl:Thing rdf:nodeID=”id1″>
<owl:sameAs rdf:nodeID=”id2″/>  </owl:Thing></rdf:RDF>

Tabii günümüzdeki bu anlambilim dilleri henüz bir süper-set olmaktan uzak. Yine de gidilecek yola ilişkin fikir veriyorlar.

Bu diller, WordNet gibi bir veritabanı ile ilişkilendirildikten sonra her dilde yeniden ifade-etme işlemlerinde kullanılabilirler.

Söze-dökme diyebileceğimiz bu işlem için her dile özgü bir çözücü yazılmalıdır.

Bu anlambilim dillerinde fiiller dilin içine gömülü olduğundan genellikle bir tek isimlerin sözcük karşılıklarına bakmak kalıyor.

Örneğin yukarıdaki OWL dilindeki metin dillere de ilgili dilin çözücüsü ile aktarılacaktır:

(daha&helliip;)

Read Full Post »