site.btaАрхивите на БТА са национално богатство, каза Свобода Тодорова на семинар на Европейското пространство за езикови данни и БАН

Иван Долев

Европейското пространство за езикови данни и Институтът за български език при БАН организират семинар, посветен на ролята на езиковите данни за развитието на езиковите технологии и инструментите, базирани на изкуствен интелект. На снимката: ръководителят на проекта по Плана за възстановяване и устойчивост в БТА Свобода Тодорова.Снимка: Минко Чернев/БТА (ЕВ)

София,

08.10.2025 16:21

(БТА)

Етикети

Наука и техника

Архивите на Българската телеграфна агенция (БТА) са национално богатство. Тяхната дигитализация и управление ще ги превърнат в активна платформа за изследвания, иновации и културна памет, каза Свобода Тодорова, ръководител на проекта "Дигитален архив", реализиран от БТА, в рамките на Плана за възстановяване и устойчивост.

Тя участва в панелна дискусия на тема „Производство, управление и развитие на пазара на езикови данни: преодоляване на препятствията", където представи своя доклад на тема „Създаване и управление на езикови данни в Българската телеграфна агенция“. Събитието се проведе в рамките на семинар, посветен на ролята на езиковите данни за развитието на езиковите технологии и инструментите, базирани на изкуствен интелект.

Организатор на събитието бяха Европейското пространство за езикови данни и Институтът за български език при БАН, а модератор на панела беше проф. д-р Силвия Илиева, директор на Центъра за върхови постижения GATE. В дискусията участваха още Христо Дочев (Wisertech), Иван Ванков (Iris.ai) и Траян Косев (адвокат в сферата на интелектуалната собственост).

Свобода Тодорова отбеляза, че БТА, основана през 1898 г., е най-старата и авторитетна информационна институция в страната, която разполага с уникални езикови и визуални ресурси - фотоархив от около 1,8 милиона кадъра и журналистически архив от над пет милиона страници. „Тези ресурси представляват езикови и културни данни със стратегическо значение за българското общество“, каза тя.

Тодорова акцентира върху необходимостта от изграждане на единна дигитална инфраструктура, централизирани бази данни, стандартизирани метаданни и дългосрочни политики за съхранение и достъп. „Избираме популярни теми, за които студенти търсят достъп в архивите, защото материалите са толкова крехки - само преди да се разгледа един екземпляр, той вече е застрашен. Не можем да се занимаваме само със сканирането на всички тези материали, защото те буквално изчезват в ръцете ни“, каза още Свобода Тодорова.

Тя обясни, че обработката на архивните данни изисква значителен човешки ресурс. „Имаме продължителни контроли и това отнема време. За една страница трябват 5-6 минути, за да се изготви“, уточни тя. По думите ѝ архивните данни са достъпни, но използването им изисква предварителна заявка и подготовка. „Трябва да се изготвят документите, могат да ги подпишат и да се четат на място“, поясни тя.

Тодорова подчерта, че достъпът до архивите на БТА трябва да бъде осигурен както вътрешно – за нуждите на журналистите, така и външно – чрез обществени портали и API за разработчици. „Удобството на потребителя изисква многоезични търсачки и комбинирано търсене в текстови и фотоархиви“, посочи тя.

Ръководителят на проекта "Дигитален архив" на БТА даде конкретен пример за значимостта на архивите. „Студент, който търсеше информация за пътуване, откри изключително ценен материал в нашите архиви – написан от журналисти на БТА. След 1925 г. архивът съдържа информация от всички държави по света – ежедневна, дългосрочна, официална информация. Тази уникална база данни може да послужи на изследователи, учени, студенти и представители на медиите“, добави тя.

В заключение Свобода Тодорова посочи, че изкуственият интелект ще има ключова роля в бъдещото развитие на БТА. „Технологиите ще подпомагат автоматичната анотация на снимки и текстове, семантичното търсене, машинния превод и създаването на езикови корпуси за обработка на естествен език“, каза още тя.

По време на панелната дискусия участниците обсъдиха и предизвикателствата при споделянето на езикови данни на български език. Беше отбелязано, че България изостава в изграждането на нормативна база и транспонирането на европейски директиви, включително AI Act. Участниците се обединиха, че споделянето на данни трябва да се осъществява в сигурна среда с ясни стандарти и правила, при балансиране между интересите на създателите на данни и потребностите на технологичното развитие.

/ТС/

В допълнение

Свързани новини

08.10.2025 06:10

Опитът на БТА в дигитализацията ще бъде представен на семинар, организиран от Европейското пространство за езикови данни и БАН

Европейското пространство за езикови данни и Институтът за български език при Българската академия на науките организират семинар, посветен на ролята на езиковите данни за развитието на езиковите технологии и инструментите, базирани на изкуствен

07.10.2025 14:54

Опитът на БТА в дигитализацията ще бъде представен на семинар, организиран от Европейското пространство за езикови данни и БАН

29.09.2025 16:44

Архивът на Българската телеграфна агенция е богатство с национално значение, каза в Пловдив директорът на дирекция „Архиви и справочна“

Архивът на Българската телеграфна агенция (БТА) е богатство с национално значение, който съхранява повече от 125 години историята на България и света. Това каза Десислава Севова, директор на дирекция „Архиви и Справочна“ на БТА на днешната специална

22.08.2025 14:43

Благодарение на архива на БТА бе установено, че Стела Авишай е българската журналистка, беседвала с Че Гевара в Куба през 1960 г.

Архивът на Българската телеграфна агенция (БТА) помогна за намирането на отговора на въпроса, коя е била българската журналистка, срещала се и разговаряла в Хавана през 1960 г. с легендарния Ернесто Че Гевара, каза за БТА доц. Борис Наймушин от Нов

Потвърждение

Моля потвърдете купуването на избраната новина

Поклонението пред Асен Шопов ще се състои днес в столичния храм „Свети Седмочисленици“

Общинските съветници в Мадан гласуваха 3123,97 евро заплата на кмета

Около 30% от решенията на Общинския съвет в Мадан за втората половина на 2025 г. са свързани с приемане и изменения на наредби, правилници, програми

Товарен самолет, превозващ пари, се разби край столицата на Боливия; най-малко 15 души загинаха, съобщиха властите

Кая Калас призова Афганистан и Пакистан за деескалация и диалог

Хърватия успешно завърши процеса на разминиране близо 30 години след войната, каза хърватският вътрешен министър

АТА: Международното летище на Тирана и летище Милано Бергамо засилват професионалното и оперативно сътрудничество

МИНА: ЕБВР повиши прогнозата си за икономическия растеж на Черна гора

След установени сериозни нарушения швейцарският финансов регулатор нареди обявяването в ликвидация на „ЕмБер мърчънт банк“

Трайчо Трайков увери, че никой клиент няма да бъде ощетен от неправилно завишени сметки за ток

Разнопосочно приключи последната февруарска сесия на водещите борси в Европа

Поклонението пред Асен Шопов ще се състои днес в столичния храм „Свети Седмочисленици“

Италианската изпълнителка Дитонелапиага е големият победител в конкурса за най-добър дуетен кавър на фестивала в Сан Ремо

С различни дейности с ловешко сдружение разкрива езиковото многообразие и значение на майчиния език

Жулиен Риков: Подготвен съм добре за SENSHI 30, публиката да очаква много колена и много кръв

Диян Димитров: Сигурен съм, че публиката на SENSHI ще се наслади на едно истинско шоу

Националът Мартин Минчев се разписа за Краковия в полската Екстракласа

Опитът на БТА в дигитализацията ще бъде представен на семинар, организиран от Европейското пространство за езикови данни и БАН

Опитът на БТА в дигитализацията ще бъде представен на семинар, организиран от Европейското пространство за езикови данни и БАН

Архивът на Българската телеграфна агенция е богатство с национално значение, каза в Пловдив директорът на дирекция „Архиви и справочна“

Благодарение на архива на БТА бе установено, че Стела Авишай е българската журналистка, беседвала с Че Гевара в Куба през 1960 г.

Българска телеграфна агенция

Към 06:17 на 28.02.2026 Новините от днес

Товарен самолет, превозващ пари, се разби край столицата на Боливия; най-малко 15 души загинаха, съобщиха властите

Събитията днес България

Поклонението пред Асен Шопов ще се състои днес в столичния храм „Свети Седмочисленици“

Кая Калас призова Афганистан и Пакистан за деескалация и диалог

Италианската изпълнителка Дитонелапиага е големият победител в конкурса за най-добър дуетен кавър на фестивала в Сан Ремо

Хърватия успешно завърши процеса на разминиране близо 30 години след войната, каза хърватският вътрешен министър

Мерц не вижда смисъл от по-нататъшни преговори с Русия за Украйна

Афганистанските талибани са готови за преговори с Пакистан след въздушните удари срещу Кабул и Кандахар

Боливийски военен самолет се разби над оживена улица близо до Ла Пас

Съветът за сигурност на ООН отмени санкциите срещу групировката "Хаят Тахрир аш Шам" на сирийския президент

Иран се съгласи да не складира обогатен уран, заяви оманският външен министър

Норвежки тийнейджър е планирал атака срещу база на НАТО

ПАП: Доналд Туск заяви, че програмата за отбрана на ЕС „СЕЙФ" е създадена по инициатива на Полша

Иран се съгласи да не складира обогатен уран, заяви оманският външен министър

site.btaАрхивите на БТА са национално богатство, каза Свобода Тодорова на семинар на Европейското пространство за езикови данни и БАН

Споделете

В допълнение

Избиране на снимки

Изтегляне на снимки

Свързани новини

Потвърждение

Към 06:17 на 28.02.2026 Новините от днес