Bbabo NET

Sanat Haberler

Bulgaristan Bilimler Akademisi'ndeki Bulgar Dili Enstitüsü'nde çok dilli bir görsel külliyatı geliştiriliyor

Sofya, 11 Şubat (bbabo.net)

Görüntülü çok dilli derlem, Bulgaristan Bilimler Akademisi'ndeki (BAS) Bulgar Dili Enstitüsü "Profesör Lubomir Andreychin" Hesaplamalı Dilbilim Bölümü uzmanları tarafından geliştirilmektedir. Projeyi sunan enstitüden Svetla Koeva tarafından temsil edildi. Bu, Bulgaristan'da bugün çevrimiçi olarak gerçekleştirilen Avrupa Dil Ağının tanıtımına yönelik ilk etkinlik sırasında gerçekleşti.

Koeva, şu ana kadar ağırlıklı olarak metin işlemeyle uğraştıklarını ve ekibin bir kısmının bir süredir konuşma işlemeyle uğraştığını söyledi. Koeva, resimleri, açıklamaları ve diğer kısa metinleri bir araya getiren bu projenin zorlu olduğunu belirterek, projenin henüz tamamlanmadığını, ancak sona ermek üzere olduğunu da sözlerine ekledi.

Çok dilli görüntü derlemi, tematik olarak ilgili alanlarda bulunan özenle seçilmiş görüntüleri toplar. Ayrıca, görsellerin hem akademik hem de ticari amaçlarla serbestçe yeniden kullanılabilir olması gerektiğini açıkladı.

Koeva, görüntülerde gözlemlenebilen nesnelerin yeterince eksiksiz ve doğru bir şekilde tanımlanmasına izin veren bir görsel nesneler ontolojisi geliştirdiklerini kaydetti. Bu, nesnelere açıklama eklenmesine ve koleksiyonun farklı formatlar ve ortamlar açısından çeşitliliğini gösteren 25 dilde çok dilli bir açıklama ile güncellenmesine izin verdi.

Açıklamalı görüntülerin toplanması, görüntülerdeki nesnelerin otomatik olarak tanınması, hem nesnelerin hem de tüm görüntülerin otomatik olarak sınıflandırılması ve anlamsal bölümleme (bir görüntüdeki aynı sınıftaki her bir nesnenin tanınması) için kullanılabilir. Gövde, görüntüleri otomatik olarak yorumlamak, görüntü için otomatik olarak başlıklar oluşturmak ve ayrıca sorular sormak ve görüntüler için uygun yanıtları almak için kullanılabilir.

Koeva, görüntü koleksiyonunun özelliği, içindeki nesnelerin birçok sınıfa ayrılmasıdır - yaklaşık 1.500, bu ciddi bir adımdır, dedi Koeva. Hem görüntüler hem de içlerindeki nesneler için örüntü tanıma modellerinde eğitim için kullanılan birçok görüntü koleksiyonu olduğunu, ancak genellikle az sayıda sınıfa odaklandığını kaydetti.

Derlem, on binlerce görüntü ve içlerinde yüz binlerce nesne açıklaması içerir. Koeva, bunun çok küçük bir ekip tarafından bir yıldan kısa bir sürede başarıldığını söyledi.

Çok dilli derlem, Şubat ayının sonunda Avrupa Dil Ağı platformundan indirilmeye hazır olacaktır.

Seminerin amacı, dil kaynaklarını, dil işleme programlarını ve dil teknolojisi hizmetlerini paylaşmak ve yaymak için en hızlı büyüyen platformu sunmaktı. Dil teknolojileri, özellikle çok dilli olanlar, dil engellerinin üstesinden gelmeye ve ticaret, yönetim, politika, iletişim ve kültürlerarası anlayışta önemli gelişmeler sağlamaya yardımcı olabilir. Avrupa Dil Ağı, çalışma araçları ve hizmetleri ile dil verileri ve kaynakları koleksiyonları dahil olmak üzere tüm Avrupa dilleri için yüzlerce ticari ve ücretsiz dil teknolojisine entegrasyonu kolay bir bulut platformu geliştiriyor ve uyguluyor.

Bulgaristan Bilimler Akademisi'ndeki Bulgar Dili Enstitüsü'nde çok dilli bir görsel külliyatı geliştiriliyor