WikiDer > Универсальный сетевой язык

Universal Networking Language

Универсальный сетевой язык (UNL) является декларативным формальный язык специально разработан для представления семантический данные извлечены из естественный язык тексты. Его можно использовать как основной язык в межъязычный машинный перевод систем или как представление знаний язык в поиск информации Приложения.

Объем и цели

UNL разработан, чтобы создать простую основу для представления наиболее важных аспектов информации и значения в форме, независимой от машинного и человеческого языка. Как не зависящий от языка формализм, UNL стремится кодировать, хранить, распространять и извлекать информацию независимо от исходного языка, на котором она была выражена. В этом смысле UNL стремится предоставить инструменты для систематического преодоления языкового барьера.

На первый взгляд, UNL кажется своего рода интерлингва, в который исходные тексты конвертируются перед переводом на целевые языки. Фактически, его можно использовать для этой цели, причем очень эффективно. Однако его реальная сила - представление знаний, и его основная цель - предоставить инфраструктуру для обработки знаний, которые уже существуют или могут существовать на любом данном языке.

Тем не менее, важно отметить, что в настоящее время было бы глупо утверждать, что оно представляет «полное» значение любого слова, предложения или текста для любого языка. Тонкости намерения и интерпретации делают «полное значение», каким бы мы ни понимали его, слишком вариативным и субъективным для любого систематического рассмотрения. Таким образом, UNL избегает ловушек, связанных с попыткой представить «полное значение» предложений или текстов, ориентируясь вместо этого на «основное» или «согласованное» значение, которое им чаще всего приписывается. В этом смысле большая часть тонкости поэзии, метафор, образного языка, намеков и других сложных косвенных коммуникативных форм поведения выходит за рамки текущих целей и целей UNL. Вместо этого UNL нацелен на прямое коммуникативное поведение и буквальное значение как осязаемую, конкретную основу для большинства человеческих коммуникаций в практических, повседневных условиях.

Структура

В подходе UNL информация, передаваемая естественным языком, представлена ​​предложением за предложением в виде гиперграфа, состоящего из набора направленных двоичных помеченных ссылок (называемых связи) между узлами или гиперузлами ( Универсальные слова, или просто UWs), которые обозначают понятия. UW также можно аннотировать с помощью атрибуты представление контекстной информации.

Например, английское предложение «Небо было синим ?!» на языке UNL может быть представлено следующим образом:

UNLGraph.svg

В приведенном выше примере «небо (icl> мир природы)» и «синий (icl> цвет)», которые представляют отдельные концепции, являются UW; «aoj» (= атрибут объекта) - это направленное бинарное семантическое отношение, связывающее два UW; а «@def», «@interrogative», «@past», «@exclamation» и «@entry» - это атрибуты, изменяющие UW.

UW предназначены для представления универсальных концепций, но выражаются английскими словами или на любом другом естественном языке для удобства чтения. Они состоят из «заглавного слова» (корень UW) и «списка ограничений» (суффикс UW в круглых скобках), где ограничения используются для устранения неоднозначности общей концепции, передаваемой заглавным словом. Набор UW организован в онтологии UNL, в которой концепции высокого уровня связаны с концепциями более низкого уровня через отношения «icl» (= является разновидностью), «iof» (= является экземпляром) и « equ "(= равно).

Отношения предназначены для представления семантических связей между словами на всех существующих языках. Они могут быть онтологическими (например, «icl» и «iof», упомянутые выше), логическими (например, «и» и «или») и тематическими (например, «agt» = агент, «ins» = инструмент, «tim» = время, «plc» = место и т. д.). В настоящее время в спецификациях UNL 46 отношений. Они совместно определяют синтаксис UNL.

Атрибуты представляют информацию, которая не может быть передана UW и отношениями. Обычно они представляют информацию о времени («@past», «@future» и т. Д.), Справке («@def», «@indef» и т. Д.), Модальности («@can», «@must», и т. д.), фокус («@topic», «@focus» и т. д.) и т. д.

В программе UNL процесс представления предложений на естественном языке в графах UNL называется UNLization, а процесс создания предложений на естественном языке из графов UNL называется NLization. UNLization, который включает в себя анализ и понимание естественного языка, предназначен для выполнения полуавтоматически (то есть людьми с помощью компьютеров); и NLization предполагается проводить полностью автоматически.

История

Программа UNL началась в 1996 году по инициативе Института перспективных исследований Университет ООН в Токио, Япония. В январе 2001 года Университет Организации Объединенных Наций учредил автономную организацию UNDL Foundation, которая будет отвечать за разработку и управление Программой UNL. Фонд, некоммерческая международная организация, имеет независимую идентичность от Университета Организации Объединенных Наций, хотя имеет особые связи с ООН. Он унаследовал от УООН / ИПИ мандат на реализацию Программы UNL, чтобы он мог выполнять свою миссию.

Программа уже преодолела важные вехи. Общая архитектура системы UNL была разработана с набором базового программного обеспечения и инструментов, необходимых для ее функционирования. Они проходят испытания и улучшаются. За последние несколько лет было накоплено огромное количество лингвистических ресурсов по различным родным языкам, которые уже находятся в стадии разработки, а также по выражению UNL. Более того, техническая инфраструктура для расширения этих ресурсов уже существует, что с этого момента способствует участию гораздо большего числа языков в системе UNL. Ежегодно публикуется все больше научных работ и академических диссертаций по UNL.

Наиболее заметным достижением на данный момент является признание Договором о патентном сотрудничестве (PCT) инновационного характера и промышленной применимости UNL, которое было получено в мае 2002 г. через Всемирную организацию интеллектуальной собственности (WIPO). Получение патентов (патенты США 6,704,700 и 7,107,206) для UNL является совершенно новым достижением в Организации Объединенных Наций.

Смотрите также

внешняя ссылка

Общество UNL