18+

В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS». Об этом 21 декабря сообщила пресс-служба ТГУ.

Задача сервиса - ускорить сбор информации, публикации новости и решить вопрос с достоверностью журналистских материалов. Проект разрабатывается и будет реализован совместно с партнером ТГУ — международной группой IT-компаний «Элекард».

Разработанная нейросеть способна создавать и проверять новости с помощью нейронных сетей и синтаксических программ, проводящих анализ данных с веб-ресурсов. Они работают на основе лингвистического преданализа особенностей текста, создания тематических словарей и формальных грамматик. Нейросеть извлекает из неструктурированных текстов факты (по модели «кто, что, где, когда») и синтезирует заголовок новости. Если на поиск и анализ у журналиста уходит минимум пять минут, то машина справляется с этим в считанные секунды. При этом ценность журналиста как творческой единицы, способной к аналитике и интерпретации, становится выше.

Аналогичные программы уже существуют, но функционал созданного молодыми учёными ТГУ сервиса гораздо шире. Например, пользователь может выбрать вариант заголовка как полностью собранного нейросетью, так и образованного при помощи формальных грамматик, что позволяет формировать и стиль новостного текста. Преимущество «WORLD2NEWS» — высокая формальная точность. Это делает сгенерированные тексты максимально похожими на журналистские. Точность определяется по показателям BLEU-score, алгоритма оценки качества текста, автоматически переведенного с одного естественного языка на другой. Качество перевода определяется правилом: «чем ближе машинный перевод к профессиональному человеческому переводу, тем лучше».

Ранее члены команды рассказывали о том, что работа начиналась как обычный студенческий проект. Уже в процессе реализации был создан сервис с набором востребованных при автоматической обработки текстовой информации функций.

Разработчики онлайн-сервиса не собираются останавливаться на достигнутом. Пока что «WORLD2NEWS» — лишь действующий прототип. В планах работа по оптимизации формальных грамматик и разработке новых решений, основанных на нейронных сетях.

URL: http://m.babr24.net/?IDE=208647

bytes: 2444 / 2371

Обсудить на форуме Бабра в Telegram

Поделиться в соцсетях:

Другие статьи и новости в рубрике "Интернет и ИТ" (Томск)

Томская область попала в «красную зону» свободы в интернете

Правозащитники включили Томскую область в чисто регионов, где больше всего ведётся преследование в интернете.

В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и ...

Автор: Пепел.

Источник: Babr24.

Интернет и ИТ, Наука и технологии

Томск

5648

24.12.2020

Инсайд. 2020 год: тренды киберпреступлений

2020 год проходит в контексте вирусной повестки и не только в здравоохранении.

Автор: Максим Бакулев.

Источник: Babr24.

Интернет и ИТ, Криминал, Расследования

Мир

3461

26.11.2020

Безопасность превыше всего: что делать, если ваши данные украдены, и как предотвратить атаку мошенников

Ни один человек не застрахован от кражи личных данных мошенниками, ведь злоумышленники постоянно действуют по-новому ...

Автор: Станислав Цырь.

Источник: Babr24.com.

Интернет и ИТ, Наука и технологии

Мир

12911

22.11.2020

Спутниковый интернет Илона Маска приятно удивил первых пользователей

В октябре 2020 на территории США и Канады началось публичное бета-тестирование интернет-сервиса Starlink.

Автор: Алиса Канарис.

Источник: Babr24.com.

Интернет и ИТ, Наука и технологии

Мир

5084

20.11.2020

Цифровизация оказалась благом

Все же нужно отметить, что иногда наша власть держит слово. Путинский «червонец», то есть единовременное пособие на ребенка, я получил.

Автор: Дмитрий Верхотуров.

Источник: Babr24.

Интернет и ИТ, Экономика и бизнес, Наука и техника

Мир

16586

09.06.2020

Tele2 продлевает бесплатные мессенджеры до 15 мая для абонентов за рубежом

Tele2 продлевает возможность бесплатно обмениваться в мессенджерах текстовыми сообщениями в международном роуминге.

Источник: Babr24.com.

Интернет и ИТ

Мир

3514

03.05.2020

Tele2 продлила бесплатный доступ к мессенджерам для абонентов, которые не могут вернуться в Россию

Tele2 продолжает поддерживать клиентов, которые не могут вылететь в Россию из-за ограничений авиасообщения на фоне пандемии коронавируса.

Источник: Babr24.com.

Интернет и ИТ

Мир

3056

07.04.2020

Бесплатные обои для рабочего стола с видами Байкала выпустила Microsoft

У компании Microsoft появился бесплатный пакет обоев для рабочего стола с видами озера Байкал. Он называется незатейливо - Lake Baikal.

Источник: Babr24.com.

Интернет и ИТ

Мир, Байкал

4641

30.09.2019

Мессенджер WhatsApp будет судиться с клиентами из-за рассылок

Новые правила пользования вводит популярный в России мессенджер WhatsApp.

Источник: Babr24.com.

Интернет и ИТ, Общество

Мир

5176

12.06.2019

Пользователей Mozilla Firefox затопило всплывающей рекламой

В 00:00 по UTC 4 мая у части пользователей браузера Firefox от Mozilla отключились все расширения.

Автор: Саша Савельева.

Источник: Babr24.com.

Интернет и ИТ

Мир

9792

06.05.2019

Инсайд. YouTube 2018 — очень проблемный год главного видеохостинга Сети

13 декабря YouTube Rewind 2018 стал роликом с самым большим количеством дизлайков в истории.

Автор: Василий Чайкин.

Источник: Babr24.

Интернет и ИТ

Мир

7461

06.01.2019