ИИ помогает агентству Reuters собирать новости

01 дек, 10:00

Reuters совместно с Alibaba использует ИИ под названием Tracer для отбора новостей через Twitter и проверки их подлинности. В будущем подобные программы могут помочь журналистам справиться с растущим информационным потоком, пишет MIT Technology Review.

Новостные агентства, чтобы выжить в эпоху интернета, стараются внедрять последние технологии написания заметок и поиска информации с помощью искусственного интеллекта. Так, служба новостей в Associated Press использует программу, которая сообщает о событиях, вставляя заголовки в заранее подготовленные шаблоны, вроде: «Компания X о прибыли в размере Y в Z квартале».

Однако Reuters пошло дальше. Недавно агентство внедрило ИИ под названием Tracer, который должен полностью автоматизировать подбор новостей и заодно проверять их на подлинность. Это не значит, что журналисты перестанут быть востребованными — скорее, программа поможет им «переварить» растущий с каждым днем информационный поток, как сообщает сайт новостей финансовых рынков Украины и мира Elcomart.ua.

Над Tracer работают программисты из отдела Reuters Research and Development совместно с Alibaba. Ежедневно ИИ анализирует около 12 млн твитов, что составляет примерно 2% от общего числа постов. Половина из них отбирается совершенно случайно, остальные берутся из списка учетных записей Twitter, отобранных журналистами Reuters. К ним относятся другие новостные организации, крупные компании, влиятельные люди в индустриях, знаменитости и так далее.

На следующем этапе Tracer должен определить, когда произошло событие. С точки зрения алгоритма, — это время, когда о событии начинают говорить несколько человек сразу. Поэтому для этого используются кластерные алгоритмы машинного обучения. Безусловно, помимо реальных новостей в эти кластеры попадает всякий спам, реклама и обычный чат. Поэтому Tracer должен сделать дополнительный отсев.

Для этого он должен определить тему разговора, после чего сравнивает ее с базой данных тем, собранных журналистами из «официальных» аккаунтов, таких как CNN, BBCBreaking, nytimes, BreakingNews. На этом этапе алгоритм также определяет местоположение события, используя базу данных городов и ключевые слова.

Как только разговор или слух потенциально идентифицируется программой как новость, важно выяснить, не является ли она «уткой». Для этого Tracer ищет источник, проверяя ссылки с самого раннего твита в разговоре. Затем «пробивает» их по базе данных «фейковых СМИ», вроде National Report или The Onion.

Наконец, система пишет заголовок с кратким описанием, и распространяет новость по всей международной редакции Reuters.

По словам разработчиков, Tracer оказался довольно точным. Из 12 млн твитов, которые он анализирует, примерно 80% — это «шум». Остальные разделяются на 6 тысяч кластеров, которые классифицируются как отдельные типы новостных событий. Все вычисления проводятся на 13 серверах, использующих 10 различных алгоритмов.

Инф. finance.ua


Адрес новости: http://e-finance.com.ua/show/223899.html



Читайте также: Новости Агробизнеса AgriNEWS.com.ua