|
C 2007 года наша компания занимается проблемами
компьютерной обработки текстов на естественном языке.
В частности, автоматическим определением тематики документов на основе
элементов искусственного интеллекта, использующих онтологическую базу
знаний для извлечения информации.
В 2009 году был разработан "Способ позиционирования текстов в пространстве знаний на основе множества онтологий" (патент РФ № 2476927). В 2012 создана система и метод тематической категоризации текстов на основе онтологий (US Patent No.: US 8,782,051 "System and method for text categorization base on ontologies"). Первым пользователем проекта Гитика в 2009 году стал «Координационный Центр доменов RU/РФ». Наши технологии использовались для автоматической генерации раздела «Новости доменной индустрии» на сайте КЦ. С 2016 года технология тематической категоризации применяется в «ИА ИТАР-ТАСС». В настоящее время проект Гитика включает в себя одноименную экспертную систему, база знаний которой состоит из нескольких сотен онтологий, содержащих более 650 тысяч понятий и свыше 10 млн. диагностик. Экспертная система различает более 300 тысяч персон и организаций и является основой для работы тематического категоризатора, поисковой системы Гитика и еще нескольких приложений, которые позволяют эффективно раскладывать информационные массивы по темам и создавать для пользователей автоматические индивидуальные информационные разделы.
С работой системы Гитика можно ознакомиться на
примерах, созданных по материалам открытых информационных источников:
|
||||||||||||
Copyright © 2007-2024 ООО «RelTeam» |