TÜBİTAK-SOBAG – 109K104 “Türkiye Türkçesi Söz Varlığında Sıfatların Eşdizimliliği -Derlem-tabanlı Bir Uygulama”

TÜBİTAK-SOBAG – 109K104 “Türkiye Türkçesi Söz Varlığında Sıfatların Eşdizimliliği -Derlem-tabanlı Bir Uygulama” Mersin [Yürütücü]

Proje Özeti

Bir dilin temel söz varlığını derlemek sözlükbilimin (lexicology) çalışmalarının ana amaçlarındandır. Sözlükbilim sadece ana dilin kullanıcıları için genel amaçlı bir sözlük değil belirgin amaçlar doğrultusunda hazırlanmış özel amaçlı sözlükler (atasözleri ve deyimler sözlüğü, terim sözlükleri, eş anlamlı sözcükler sözlüğü, zıt anlamlı sözcükler sözlüğü, eşdizim sözlüğü vb.) oluşturmakla da ilgilenir. Bugün, Türkiye Türkçesinin söz varlığı üzerine yapılan çalışmalar değerlendirildiğinde genel amaçlı sözlük çalışmalarının yanında özel amaçlı sözlük çalışmalarının yetersizliği ve sınırlılığı açıkça gözlemlenmektedir. Sözlükbilimde özel amaçlı çalışmaların bir ürünü olan eşdizim sözlüğü Türkiye Türkçesinin söz varlığı çalışmalarında üzerinde durulmayan bir konu olarak karşımıza çıkmaktadır. Öte yandan, eşdizimlilik literatürde, özellikle de derlem dilbilim (corpus linguistics) alanındaki çalışmalarda, sözlükbilimde dil öğretimi alanında önceliklerin belirlenmesi aşamasında çokça baş vurulan bir yöntem olarak yerini almıştır.

Bu projenin amacı, Türkiye Türkçesinin söz varlığını barındıran Güncel Türkçe Sözlük’te (GTS), madde başı ve madde içi olarak sözlükbirimselleştirilmiş 12.225 sıfat tanımlı sözlükbirimi eşdizimlilikleri açısından derlem tabanlı bir uygulama temelinde değerlendirmektir. Proje; amaç, kapsam ve yöntem açısından benzer çalışmalarda deneyimli bir yürütücü tarafından yürütülmesinin yanında Türkiye Türkçesi için bir ilk olma özelliğini de taşımaktadır.

Bu projede, GTS’nin sıfat temelli bir ‘derlem-denetimini’ yapmak, ana dili ve ikinci dil öğretiminde önemli bir yere sahip olan eşdizimsel yapıları Türkçe için bu eksende tespit etmek amaçlanmıştır.

Bu projeyle ulaşılması beklenen sonuçlar şöyle sıralanabilir: 1. Genelde dil özelde de Türkçede yoğun bir kullanıma sahip olan sıfatların dizimsel özellikleri belirlenmiş olacaktır. 2. Türkçenin söz varlığını barındıran GTS’de sıfatların anlamsal ve dizimsel bir derlem-denetimi yapılmış olacaktır. 3. Türkçede sıfat-ad ve ad-sıfat ilişkisinde kavram alanları belirlenmiş olacaktır. 4. Türkçenin ana dili ve yabancı dil olarak öğretimi konusunda sıfat-ad ilişkiselliği temelinde var olan kullanım görünümleri sıklık temelli olarak belirlenmiş olacaktır. 5. Türkiye Türkçesinin eşdizim sözlüğü için temel veriler derlenmiş olacaktır. 6. Sıfatların kullanım sıklıkları ve dil öğretimindeki önceliklerinin yanında adların da sıklıkları ve dil öğretimindeki öncelikleri belirlenmiş olacaktır. 7. Sözcük türü olarak GTS’de yer alan sıfatların söz varlığında adlarla ilişkisellikleri, anlamsal özellikleri belirlenmiş olacaktır. 8. Türkiye Türkçesinde sıfatlar ile ilgili devam çalışmalarında önemli ölçütte veri derlenmiş ve diğer araştırmacıların kullanımına sanal ortamda sunulmuş olacaktır.

Proje, temelde verilerin derlenmesi, bu verilerin işaretlenmesi ve değerlendirilmesi, projenin sonuçlandırılması ve yayımlanması olmak üzere üç aşamadan oluşmaktadır.

Birinci aşamada, Türkiye Türkçenin yazın diline ait çeşitli türlerde metin parçaları [5846 numaralı Fikir ve Sanat Eserleri Kanunu’nun Madde 35 (1-4 Fıkralar), Madde 36, Madde 37.’de belirtilen hükümler çerçevesinde] (http://www.mevzuat.adalet.gov.tr/html/957.html) ile internet ortamından seçtiğimiz 25 milyon sözcüklük konu duyarlı bir derlem (corpus), amacımıza uygun olarak sayısallaştırılacak, MYSQL veri tabanı uygulamasıyla ve PHP aracılığıyla tümcesel olarak derlenebilir hâle getirilecektir. İkinci aşamada, veriler söz konusu derlemden kullanıldıkları adlar temel alınarak ilgili dizgeler işaretlenecek, ayıklanacak dizimsel ve anlamsal olarak birbiriyle bağdaşıklık gösteren sıfatlar ve adlar eşdizimlilikleri çerçevesinde değerlendirilecektir. Üçüncü aşama ise elde edilen sonuçlar yayımlanacaktır.

 

Project Summary

To collect the main vocabulary of a language is the major aims of lexicology works. Lexicology looks after to prepare not only for general purpose lexicon for mother tongue users but also particular purpose lexicons for special aims (e.g. proverbs and idioms dictionary, terms dictionary, synonym words dictionary, antonym words dictionary, collocation dictionary etc.). Today, when the studies are considered about the vocabulary of Turkey Turkish, general purpose lexicon works, and particular purpose lexicons for special aim works are insufficient and limited. In lexicology, collocation dictionary is one of the main products of lexicology, seen as a non mentioned subject at the study of Turkey Turkish vocabulary. On the other hand, in lexicology, collocation has been taken place in literature as an important applying method, especially in the corpus linguistics applications and defining the stage of preferences in language teaching

This project’s object is to investigate the collocations defined as adjective and lexicalized 12.225 lexemes as headword and inword in Güncel Türkçe Sözlük (Living Turkish Dictionary) which is including the vocabulary of Turkey Turkish in a corpus-based approach. Project has speciality being the first about purpose, content and method also executing by experienced researchers at similar studies.

The anticipated outcomes of this project are as follows: 1. It will be defined the adjectives’s syntactic features which have intense usage in generally language and specially in Turkish. 2. It will be made semantic and syntactic corpus-control of adjectives in Güncel Türkçe Sözlük (Living Turkish Dictionary) which is including the vocabulary of Turkey Turkish. 3. It will be defined the concept domains of adjectives-noun and noun-adjectives relationship in Turkish. 4. It will be defined the adjective-noun usages appearance relationships about mother tongue and second language teaching for Turkish based by frequency. 5. It will be collected main data for Turkey Turkish Collocation Dictionary. 6. It will be defined usage of adjectives frequency and priorities of language teaching and usage of nouns frequency and priorities of language teaching. 7. It will be defined adjectives’s relationship with nouns and semantic specialities as a part of speech in GTS. 8. It will be collected significant data about adjectives for other studies and could be accessed in online media.

Project has mainly three stages: 1- Collecting the data. 2- Annotation and commenting the data 3- Concluding and publishing the project results. In the first stage; a corpus which including about 25 million words were collected from various thematic texts that belong to Turkey Turkish written language and also internet [according to number 5846 Fikir ve Sanat Eserleri Kanunu, Clause 35 (1-4), 36 and 37.] (http://www.mevzuat.adalet.gov.tr/html/957.html) will be digitized and will be become to examined as syntactic by using MYSQL data management program and PHP. In the second stage; the data from the corpus will be marked up by noun-basis and syntactic, selected and the adjectives and nouns that have cohesion between each other will be commented by collocational frame. In the third stage; the results of the project will be published.

 

Bülent Özkan

Prof. Dr. Bülent ÖZKAN Eğitim Fakültesi/ Türkçe Eğitimi A.B.D

0 Yorum

Yorum Yok!

Henüz yorum yok, bu yazıya ilk yorumu sen yapabilirsin.

Yorum yap

Only registered users can comment.