Bbabo NET

Art Xəbərlər

Bolqarıstan Elmlər Akademiyasının Bolqar Dili İnstitutunda çoxdilli şəkillər korpusu hazırlanır.

Sofiya, 11 fevral (bbabo.net)

Şəkillərlə çoxdilli korpus Bolqarıstan Elmlər Akademiyasının (BAS) nəzdində “Professor Lubomir Andreyçin” Bolqar Dili İnstitutunun Hesablama Dilçilik şöbəsinin mütəxəssisləri tərəfindən hazırlanır. Onu layihəni təqdim edən institutdan Svetla Koeva təmsil edib. Bu, Bolqarıstanda Avropa Dil Şəbəkəsinin təbliği ilə bağlı bu gün onlayn keçirilən ilk tədbir zamanı baş verib.

Koeva bildirib ki, indiyədək onlar əsasən mətnin işlənilməsi ilə məşğul olublar, komandanın bir hissəsi isə bir müddətdir ki, nitqin işlənməsi ilə məşğul olub. Şəkillər, annotasiyalar və digər qısa mətnləri birləşdirən bu layihənin çətin olduğunu deyən Koeva, hələ tamamlanmadığını, lakin sona çatmaq üzrə olduğunu bildirib.

Çoxdilli şəkil korpusu tematik olaraq əlaqəli sahələrdə olan diqqətlə seçilmiş şəkilləri toplayır. Bundan əlavə, şəkillər həm akademik, həm də biznes məqsədləri üçün sərbəst şəkildə təkrar istifadə edilə bilər, deyə izah etdi.

Koeva qeyd edib ki, onlar təsvirlərdə müşahidə oluna bilən obyektlərin kifayət qədər tam və dəqiq təsvirinə imkan verən vizual obyektlərin ontologiyasını hazırlayıblar. Bu, obyektlərin annotasiyasını və 25 dildə çoxdilli təsviri ilə təkmilləşdirməyə imkan verdi ki, bu da kolleksiyanın müxtəlif formatlar və media baxımından müxtəlifliyini göstərir.

Annotasiya edilmiş şəkillər toplusundan şəkillərdəki obyektlərin avtomatik tanınması, həm obyektlərin, həm də bütöv şəkillərin avtomatik təsnifatı və sözdə semantik seqmentasiya (şəkildə eyni sinifin hər bir obyektinin tanınması) üçün istifadə edilə bilər. Bədən şəkilləri avtomatik şərh etmək, təsvir üçün avtomatik başlıqlar yaratmaq, həmçinin suallar vermək və şəkillərə uyğun cavablar almaq üçün istifadə edilə bilər.

Şəkillər kolleksiyasının xarakterik cəhəti ondadır ki, oradakı obyektlər bir çox siniflərə - təqribən 1500-ə bölünür, bu, irəliyə doğru ciddi addımdır, - Koeva bildirib. O qeyd etdi ki, həm təsvirlər, həm də onlarda olan obyektlər üçün naxışların tanınması modellərinin öyrədilməsi üçün istifadə olunan, lakin adətən az sayda siniflərə yönəldilmiş çoxlu şəkillər kolleksiyaları var.

Korpusda on minlərlə təsvir və onlarda obyektlərin yüz minlərlə annotasiyası var. Koeva dedi ki, buna çox kiçik bir insan komandası bir ildən az müddətdə nail olub.

Çoxdilli korpus fevralın sonunda Avropa Dil Şəbəkəsi platformasından yükləmək üçün əlçatan olacaq.

Seminarın məqsədi dil resurslarının, dil emal proqramlarının və dil texnologiyası xidmətlərinin paylaşılması və yayılması üçün ən sürətlə inkişaf edən platformanı təqdim etmək idi. Dil texnologiyaları, xüsusən də çoxdilli olanlar, dil maneələrini aradan qaldırmağa və ticarət, idarəetmə, siyasət, ünsiyyət və mədəniyyətlərarası anlaşmada əhəmiyyətli təkmilləşdirmələrə kömək edə bilər. Avropa Dil Şəbəkəsi bütün Avropa dilləri üçün yüzlərlə kommersiya və pulsuz dil texnologiyalarına, o cümlədən işçi alətlər və xidmətlərə, həmçinin dil məlumatı və resurslarının kolleksiyalarına asan inteqrasiya imkanı verən bulud platforması hazırlayır və həyata keçirir.

Bolqarıstan Elmlər Akademiyasının Bolqar Dili İnstitutunda çoxdilli şəkillər korpusu hazırlanır.