WikiDer > Ссылающаяся генерация выражения

Referring expression generation

Ссылающаяся генерация выражения (REG) является подзадачей генерация естественного языка (NLG), получивший наибольшее внимание ученых. Хотя NLG занимается преобразованием неязыковой информации в естественный язык, REG фокусируется только на создании ссылающиеся выражения (словосочетания), которые определяют конкретные сущности, называемые цели.

Эту задачу можно разделить на два раздела. В выбор содержания определяет, какой набор свойств различает намеченную цель и лингвистическая реализация Часть определяет, как эти свойства переводятся на естественный язык. В сообществе NLG было разработано множество алгоритмов для генерации различных типов ссылающихся выражений.

Типы ссылающихся выражений

А ссылающееся выражение (RE) в лингвистике - это любое словосочетание, или суррогат существительного, функция которого в дискурсе идентифицировать какой-то отдельный объект (вещь, существо, событие ...) техническая терминология за идентифицировать сильно отличается от одной школы лингвистики к другой. Вероятно, самый распространенный термин ссылаться, и идентифицированная вещь референт, как например в работе Джон Лайонс. В лингвистике изучение референтных отношений относится к прагматика, изучение использования языка, хотя оно также представляет большой интерес для философов, особенно тех, кто хочет понять природу знание, восприятие и познание в более общем смысле.

Для справки можно использовать различные устройства: определители, местоимения, имена собственные... Ссылочные отношения могут быть разных видов; референты могут находиться в «реальном» или воображаемом мире, в самом дискурсе, и они могут быть единственными, множественными или коллективными.

Местоимения

Самый простой тип ссылающихся выражений: местоимение Такие как он и Это. Сообщества лингвистики и обработки естественного языка разработали различные модели для прогнозирования референтов анафоры, такие как теория центрирования,[1] и в идеале генерация ссылающегося выражения должна быть основана на таких моделях. Однако большинство систем NLG используют гораздо более простые алгоритмы, например, с использованием местоимения, если референт был упомянут в предыдущем предложении (или предложении), и в этом предложении не было упомянуто ни одного другого объекта того же пола.

Определенные словосочетания с существительными

Было проведено значительное количество исследований по созданию определенных именных фраз, таких как большая красная книга. Во многом это основано на модели, предложенной Дейлом и Рейтером.[2] Это было расширено различными способами, например Krahmer и другие.[3] представить теоретико-графическую модель определенного поколения NP со многими хорошими свойствами. В последние годы на мероприятии с разделяемой задачей сравниваются различные алгоритмы для определенного поколения NP с использованием TUNA.[4] корпус.

Пространственная и временная привязка

В последнее время было проведено больше исследований по созданию референцных выражений для времени и пространства. Такие ссылки обычно неточны (каково точное значение сегодня вечером?), а также по-разному интерпретироваться разными людьми.[5] Следовательно, может потребоваться явное рассуждение о компромиссах между ложноположительными и ложноотрицательными и даже вычислить полезность различных возможных выражений ссылки в конкретном контексте задачи.[6]

Критерии хороших выражений

В идеале хорошее ссылающееся выражение должно удовлетворять ряду критериев:

  • Ссылочный успех: Он должен однозначно идентифицировать референт для читателя.
  • Легкость понимания: Читатель должен уметь быстро его прочитать и понять.
  • Вычислительная сложность: Алгоритм генерации должен быть быстрым
  • Никаких ложных выводов: Выражение не должно сбивать с толку или вводить читателя в заблуждение, предлагая ложные импликатуры или другие прагматические выводы. Например, читатель может запутаться, если ему скажут Сядьте за коричневый деревянный стол в контексте, где есть только одна таблица.[2]

История

Эра до 2000 года

REG восходит к ранним дням существования NLG. Один из первых подходов сделал Виноград.[7] в 1972 году, который разработал "добавочный"Алгоритм REG для его ШРДЛУ программа. Впоследствии в 1980-х годах исследователи начали моделировать человеческие способности создавать отсылочные выражения. На этот новый подход к теме повлияли исследователи Аппельт и Кронфельд, создавшие программы KAMP и BERTRAND.[8][9][10] и считал упоминание выражений частями более крупных речевых актов.

Некоторые из их наиболее интересных открытий заключались в том, что ссылающиеся выражения могут использоваться для добавления информации помимо идентификации референта.[9] а также влияние коммуникативного контекста и Грайсановские изречения на ссылающиеся выражения.[8] Более того, его скептицизм относительно естественности минимальных описаний сделал исследования Аппельта и Кронфельда основой для более поздних работ над REG.

Поиск простых, четко определенных проблем изменил направление исследований в начале 1990-х годов. Этим новым подходом руководили Дейл и Райтер, которые подчеркнули идентификацию референта как центральную цель.[11][12][13][14]Как Аппельт[8] они обсуждают связь между Грайсановы максимы и ссылаясь на выражения в своей кульминационной статье[2] в котором они также предлагают формальный определение проблемы. Кроме того, Рейтер и Дейл обсуждают Полная краткость и Жадная эвристика алгоритмы, а также их Инкрементальный алгоритм(IA), который стал одним из самых важных алгоритмов в REG.[примечание 1]

Более поздние разработки

После 2000 года исследования начали отменять некоторые упрощающие предположения, которые были сделаны в ранних исследованиях REG, с целью создания более простых алгоритмов. Различные исследовательские группы сконцентрировались на разных ограничениях, создав несколько расширенных алгоритмов. Часто они расширяют IA в единственной перспективе, например, в отношении:

  • Ссылка на наборы например "владельцы футболок" или "зеленые яблоки и банан слева"[15][16][17][18]
  • Реляционные описания например «чашка на столе» или «женщина, у которой трое детей»[19][20][21][22][23]
  • Контекстная зависимость, Нечеткость и Преодолеваемый подъем включать такие утверждения, как «пожилой мужчина» или «машина слева», которые часто неясны без контекста[6][24][25]
  • Заметность и Генерация местоимений сильно зависят от дискурса, делая, например, "она" ссылкой на "(наиболее заметную) женщину"[26][27][28][29][30][31][32]

Многие упрощающие предположения все еще в силе или только начали работать. Кроме того, еще предстоит выполнить комбинацию различных расширений, и Крамер и ван Деемтер назвали ее «нетривиальным предприятием».[33]

Еще одним важным изменением после 2000 г. стало более широкое использование эмпирические исследования для оценки алгоритмов. Такое развитие произошло благодаря появлению прозрачных корпус. Хотя до сих пор ведутся дискуссии о том, какие метрики оценки лучше всего, использование экспериментальной оценки уже привело к лучшей сопоставимости алгоритмов, обсуждению целей REG и более целенаправленным исследованиям.

Кроме того, исследование расширило свой диапазон на связанные темы, такие как выбор Представление знаний(KR) Фреймворки. В этой области остается открытым главный вопрос, какой фреймворк KR наиболее подходит для использования в REG. Ответ на этот вопрос зависит от того, насколько хорошо описания могут быть выражены или найдены. Многие возможности фреймворков KR до сих пор остаются неиспользованными.

Некоторые из различных подходов включают использование:

[примечание 1]

Определение проблемы

Дейл и Рейтер (1995) думают, что выражения можно рассматривать как отличительные описания.

Они определяют:

  • В референт как сущность, которую следует описать
  • В контекстный набор как набор выдающихся сущностей
  • В набор контрастов или же потенциальные отвлекающие факторы как все элементы набора контекста, кроме референта
  • А свойство как ссылка на сингл пара атрибут-значение

Каждую сущность в домене можно охарактеризовать как набор пары атрибут-значение Например тип, собака, женский пол или же возраст, 10 лет.

Тогда проблема определяется следующим образом:

Позволять быть предполагаемым референтом, и быть набором контраста. Затем набор пар атрибут-значение будут представлять собой отличительное описание, если выполняются следующие два условия:

  1. Каждая пара атрибут – значение в относится к : то есть каждый элемент указывает значение атрибута, которое обладает.
  2. Для каждого члена из , есть хотя бы один элемент из это не относится к : то есть есть в который определяет значение атрибута, не обладает. говорят, что исключает .

Другими словами, чтобы создать ссылающееся выражение, нужно найти набор свойств, которые применяются к референту, но не к отвлекающим факторам.[2]

Проблему легко решить, объединив все свойства референта, что часто приводит к длинным описаниям, нарушающим второе Грайчанский Максим количества. Другой подход - найти кратчайшее отличительное описание, такое как Алгоритм полной краткости Тем не менее, на практике чаще всего вместо этого включают условие, согласно которому ссылочные выражения, созданные алгоритмом, должны быть как можно более похожими на созданные человеком, хотя это часто не упоминается явно.[примечание 1]

Базовые алгоритмы

Полная краткость

Алгоритм полной краткости всегда находит минимальное отличительное описание, что означает, что не существует более короткого отличительного описания в отношении используемых свойств.

Следовательно, он перебирает и проверяет каждое описание длины свойства, пока не будет найдено отличительное описание.

При таком способе создания ссылающихся выражений возникают две проблемы. Во-первых, алгоритм имеет высокую сложность, что означает NP-жесткий что делает его использование непрактичным.[40] Во-вторых, говорящие-люди производят описания, которые во многих ситуациях не являются минимальными.[41][42][43][44][примечание 1]

Жадная эвристика

Алгоритм жадной эвристики[11][12] аппроксимирует алгоритм полной краткости, итеративно добавляя к описанию наиболее отличительное свойство. Самое отличительное свойство означает свойство, исключающее большинство остальных отвлекающих факторов. Алгоритм жадной эвристики более эффективен, чем алгоритм полной краткости.[примечание 1]

Дейл и Рейтер (1995)[2] представим следующий алгоритм для жадной эвристики:

Позволять быть набором свойств, которые будут реализованы в нашем описании; позволять быть набором свойств, известных как истинные для предполагаемого референта (мы предполагаем, что не пусто); и разреши набор дистракторов (набор контраста). Таким образом, начальные условия таковы:

все отвлекающие;все свойства верны ;

Чтобы описать предполагаемый референт относительно набора контраста , делаем следующее:

1. Проверьте успех: если  тогда возвращаться  как отличительное описание elseif  тогда провал еще идти к Шаг 2.2. Выберите недвижимость: для каждого  делать:    Выбранное свойство  , куда  это самый маленький набор. идти к Шаг 3.3. Расширить описание (относительно выбранного ):            идти к Шаг 1.

Инкрементальный алгоритм

Инкрементальный алгоритм (IA) Дейла и Рейтера[2] был самым влиятельным алгоритмом до 2000 года. Он основан на идее льготный порядок атрибутов или свойств, по которым идут говорящие. Итак, чтобы запустить инкрементный алгоритм, сначала необходимо указать порядок атрибутов. Теперь алгоритм следует этому порядку и добавляет к описанию те свойства, которые исключают любые оставшиеся отвлекающие факторы. Кроме того, Дейл и Рейтер[2] подчеркните тип атрибута, который всегда включается в их описание, даже если он не исключает отвлекающих факторов.

Также значения типа являются частью иерархия подчинения включая некоторые значения базового уровня. Например, в домашний питомец домен чихуахуа входит в собака и собака к животное. Потому что собака определяется как базовый уровень собака будет предпочтительнее алгоритмов, если чихуахуа не исключает наличия отвлекающих факторов.

Инкрементальный алгоритм прост в реализации, а также эффективен с точки зрения вычислений. полиномиальное время. Описание, сгенерированное IA, может содержать избыточные свойства, которые являются лишними из-за добавленных позже свойств. Создатели не считают это слабым местом, а скорее делают выражения менее «психолингвистически неправдоподобными».[2]

Следующий алгоритм представляет собой упрощенную версию инкрементального алгоритма Дейла и Рейтера.[2] Крамер и ван Демтер[33] который принимает в качестве входных данных референт р, то D содержащий набор объектов домена и упорядоченный список для конкретного домена Pref предпочтительных атрибутов. В обозначениях L это описание, C контекстный набор отвлекающих факторов и функция RulesOut (⟨Aя, V⟩) возвращает набор объектов, которые имеют значение, отличное от V для атрибута Aя.

IncrementalAlgorithm ({r}, D, Pref) L ← ∅ C ← D - {r} для каждого Ая в списке Pref делать        V = значение (r, Aя)        если C ∩ RulesOut (⟨Aя, V⟩) ≠ ∅ тогда L ← L ∪ {⟨Aя, V⟩} C ← C - RulesOut (⟨Aя, V⟩) endif        если C = ∅ тогда возвращаться L endif    возвращаться отказ[примечание 1]

Оценка систем REG

До 2000 г. оценка систем REG носила теоретический характер, как и оценка Дейла и Рейтера.[2] В последнее время стали популярными эмпирические исследования, которые в основном основаны на предположении, что сгенерированные выражения должны быть похожи на созданные человеком. Корпусоценка на основе данных началась в REG довольно поздно из-за отсутствия подходящих наборов данных. По-прежнему корпусная оценка является наиболее распространенным методом в настоящее время, хотя существует также оценка на основе человеческого суждения.[примечание 1]

Корпусная оценка

Во-первых, различие между текстовые корпуса и должны быть изготовлены экспериментальные корпуса. Текстовые корпуса как корпус GNOME[1] может содержать тексты из любых доменов. В REG они используются для оценки реализация часть алгоритмов. В выбор содержания часть REG, с другой стороны, требует корпуса, который содержит свойства всех объектов домена, а также свойства, используемые в ссылках. Обычно это полностью "семантически прозрачные"[45] созданы в экспериментах с использованием простых и контролируемых настроек.

Эти экспериментальные корпуса снова можно разделить на Корпуса общего назначения которые были собраны для другой цели, но были проанализированы на предмет ссылок на выражения и Выделенный корпус которые сосредоточены именно на ссылочных выражениях. Примеры корпусов общего назначения: Pear Stories,[46] корпус Map Task[47] или кокосовое тело[48] а корпус епископа,[49] корпус ящика[50] и корпус TUNA[51] считать в Выделенный корпус. Корпус TUNA, который содержит собранные в Интернете данные о двух доменах, мебели и людях, уже использовался в трех общих задачах REG.[примечание 1]

Метрики оценки

Для измерения соответствия между корпусами и результатами алгоритмов REG были разработаны несколько метрик.

Чтобы измерить выбор содержания часть Коэффициент кубика[52] или MASI (Соглашение об оценке товаров с установленной стоимостью)[53] метрика. Они измеряют перекрытие свойств в двух описаниях. При оценке баллы обычно усредняются по ссылкам, сделанным разными людьми-участниками корпуса. Также иногда показатель, называемый процентом идеального отзыва (PRP)[51] или точность[54] используется для вычисления процента точных совпадений между эталонным файлом, созданным алгоритмом, и эталоном, созданным человеком.

Для лингвистическая реализация часть REG перекрытие между строками было измерено с помощью таких показателей, как BLEU[55] или же NIST.[56] Проблема, которая возникает со строковыми показателями, заключается в том, что, например, «маленькая обезьянка» измеряется ближе к «маленькому ослу», чем к «маленькой обезьянке».

Более трудоемкий способ оценки алгоритмов REG - позволить людям судить Достаточность (Насколько понятно описание?) И Беглость (Дано ли описание на хорошем и ясном английском языке?) Сгенерированного выражения. Также Белз и Гатт[57] оценил ссылающиеся выражения с помощью экспериментальной установки. Участники получают сгенерированное описание, а затем должны щелкнуть цель. Здесь можно оценить время считывания внешних показателей, время идентификации и частоту ошибок.[примечание 1]

Примечания

  1. ^ а б c d е ж грамм час я Этот раздел представляет собой отрывок из следующей статьи. Подробнее см .: E Krahmer, K van Deemter (2012). Вычислительная генерация ссылающихся выражений: обзор. Компьютерная лингвистика 38:173-218 [1]

Рекомендации

  1. ^ а б М. Поэзио, Р. Стивенсон, Б. ди Эухенио, Дж. Хитцеман (2004). Центрирование: параметрическая теория и ее экземпляры. Компьютерная лингвистика 30:309-363 [2]
  2. ^ а б c d е ж грамм час я j Р. Дейл, Э. Рейтер (1995). Вычислительная интерпретация максим Грайсена при генерации ссылающихся выражений. Наука о мышлении, 18:233–263.
  3. ^ а б Э. Крамер, С. ван Эрк, А. Верлег (2003). Генерация ссылающихся выражений на основе графиков. Компьютерная лингвистика 23: 53-72 [3]
  4. ^ [4]
  5. ^ Э. Рейтер, С. Шрипада, Дж. Хантер, Дж. Ю и И. Дэви (2005). Выбор слов в прогнозах погоды, генерируемых компьютером. Искусственный интеллект 167:137-169.
  6. ^ а б Р. Тернер, И. Шрипада, Э. Рейтер (2009) Создание приблизительных географических описаний. Материалы 12-го Европейского семинара по созданию естественного языка (ENLG), страницы 42–49, Афины. [5]
  7. ^ Т. Виноград (1972). Понимание естественного языка. Академическая пресса, Нью-Йорк. Раздел 8.3.3, Именование объектов и событий
  8. ^ а б c Д. Аппельт (1985). Планирование английских ссылающихся выражений. Искусственный интеллект, 26:1–33.
  9. ^ а б Д. Аппельт, А. Кронфельд (1987). Вычислительная модель обращения. В материалах 10-й Международной совместной конференции по искусственному интеллекту (IJCAI), страницы 640–647, Милан.
  10. ^ Кронфельд (1990). Ссылка и вычисление: очерк прикладной философии языка. Издательство Кембриджского университета, Кембридж.
  11. ^ а б Р. Дейл (1989). Придумывать отсылающие выражения. В материалах 27-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), страницы 68–75.
  12. ^ а б Р. Дейл (1992). Генерация ссылающихся выражений: построение описаний в области объектов и процессов. TheMIT Press, Кембридж, Массачусетс.
  13. ^ Э. Рейтер (1990). Вычислительная сложность избегания импликатур разговора. В материалах 28-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), страницы 97–104, Питтсбург, Пенсильвания.
  14. ^ Э. Рейтер, Р. Дейл (1992). Быстрый алгоритм генерации ссылающихся выражений. В материалах 14-й Международной конференции по компьютерной лингвистике (COLING), страницы 232–238, Нант.
  15. ^ Х. Горачек (2004). Обращаясь к множеству объектов естественно. Труды 3-й Международной конференции по генерации естественного языка (INLG), страницы 70–79, Brockenhurst.
  16. ^ Гатт, К. ван Деемтер (2007). Лексический выбор и концептуальная перспектива в генерации множественного числа ссылающихся выражений. Журнал логики, языка и информации, 16:423–443.
  17. ^ И. Х. Хан, К. ван Деемтер, Г. Ричи (2008). Генерация ссылающихся выражений: управление структурными неоднозначностями. Материалы 22-й Международной конференции по компьютерной лингвистике (COLING), страницы 433–440, Манчестер.
  18. ^ М Стоун (2000). Об идентификационных наборах. Труды 1-й Международной конференции по генерации естественного языка (INLG), страницы 116–123, Мицпе Рамон.
  19. ^ а б Р. Дейл, Н. Хэддок (1991). Генерация ссылающихся выражений, включающих отношения. Труды 5-й конференции Европейского отделения Ассоциации компьютерных лингвистов (EACL), страницы 161–166, Берлин.
  20. ^ Е. Крамер, М. Теун (2002). Эффективная контекстно-зависимая генерация описаний в контексте. В K van Deemter, R Kibble, редакторы, Обмен информацией: актуальность и новизна в обработке языков. CSLI Publications, Стэнфорд, Калифорния, страницы 223–264.
  21. ^ а б Дж. Виетен, Р. Дейл (2008). Использование пространственных отношений в ссылочных выражениях. Материалы 5-й Международной конференции по поколению естественного языка (INLG), страницы 59–67, Salt Fork, OH.
  22. ^ Й Рен, К. ван Демтер, Дж. Пэн (2010). Диаграмма возможностей Description Logic для генерации ссылающихся выражений. Труды 6-й Международной конференции по поколению естественного языка (INLG), страницы 115–124, Дублин.
  23. ^ а б Э. Крамер, М. Гоудбек, М. Теун (2014). Обращение к созданию выражений во взаимодействии: перспектива на основе графиков. Стент, С. Бангалор (ред.), Генерация естественного языка в интерактивных системах. Издательство Кембриджского университета.
  24. ^ К. ван Деемтер (2006). Создание ссылающихся выражений, которые включают в себя градуируемые свойства. Компьютерная лингвистика, 32(2):195–222.
  25. ^ Х. Горачек (2005). Создание ссылочных описаний в условиях неопределенности. Материалы 10-го Европейского семинара по созданию естественного языка (ENLG), страницы 58–67, Абердин.
  26. ^ Р. Пассонно (1996). Использование центрирования для ослабления информационных ограничений Грайса в дискурсе анафорических именных фраз. Язык и речь, 39:229–264.
  27. ^ П. У. Джордан (2000). Преднамеренное влияние на переописание объекта в диалоге: данные эмпирического исследования. Кандидат наук. защитил диссертацию в Питтсбургском университете.
  28. ^ E Hajičová (1993). Вопросы структуры предложения и паттернов дискурса - теоретическая и компьютерная лингвистика, Vol. 2. Карлов университет, Прага.
  29. ^ Б. Дж. Гросс, А. К. Джоши, С. Вайнштейн (1995). Центрирование: структура для моделирования локальной согласованности дискурса. Компьютерная лингвистика, 21:203–225.
  30. ^ Д. ДеВолт, К. Рич, К. Л. Сиднер (2004). Генерация естественного языка и контекст дискурса: вычисление отвлекающих наборов из стека фокуса. Материалы 17-го Международного собрания Флоридского общества исследований искусственного интеллекта (FLAIRS), Майами-Бич, Флорида.
  31. ^ Сиддхартхан, Совместная игра (2004). Генерация ссылающихся выражений в открытых доменах. Труды 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), страницы 407–414, Барселона.
  32. ^ Я Парабони, К. ван Деемтер, Дж. Мастхофф (2007). Генерация ссылающихся выражений: упрощение идентификации референтов. Компьютерная лингвистика, 33:229–254.
  33. ^ а б Э. Крамер, К. ван Деемтер (2012). Вычислительная генерация ссылающихся выражений: обзор. Компьютерная лингвистика 38:173-218 [6]
  34. ^ Э. Крамер, М. Теун, Дж. Вьетен, И. Хендрикс (2008). График: Стоимость избыточности в ссылочных выражениях. Материалы Международной конференции по генерации естественного языка (INLG), страницы 227–229, Salt Fork, OH.
  35. ^ К. ван Деемтер, Э. Крамер (2007). Графики и логические значения: генерация ссылающихся выражений. В H Bunt, R Muskens, редакторы, Вычислительный смысл, Том 3. Исследования в области лингвистики и философии. Издательство Springer, Берлин, страницы 397–422.
  36. ^ C Gardent (2002). Создание минимально определенных описаний. Материалы 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), страницы 96–103, Филадельфия, Пенсильвания.
  37. ^ М. Кроитору, К. ван Деемтер (2007). Концептуальный графовый подход к генерации ссылающихся выражений. Труды 20-й Международной совместной конференции по искусственному интеллекту (IJCAI), страницы 2456–2461, Хайдарабад.
  38. ^ С. Гардент, К. Стригниц (2007). Создание промежуточных определенных описаний. В H Bunt, Рейнхард Маскенс, редакторы, Вычислительный смысл, Том 3. Исследования в области лингвистики и философии. Издательство Springer, страницы 369–396, Берлин, DB.
  39. ^ С. Аресес, А. Коллер, К. Стригниц (2008). Ссылаясь на выражения как на формулы логики описания. Материалы 5-й Международной конференции по поколению естественного языка (INLG), страницы 42–49, Salt Fork, OH.
  40. ^ М. Р. Гарей, Д. С. Джонсон (1979). Компьютеры и несговорчивость: руководство по теории NP – полноты. В. Х. Фриман, Нью-Йорк.
  41. ^ Д. Р. Олсон (1970). Язык и мысль: аспекты когнитивной теории семантики. Психологический обзор, 77:257–273.
  42. ^ S Sonnenschein (1984). Влияние избыточной коммуникации на слушателей: почему разные типы могут иметь разные эффекты. Журнал психолингвистических исследований, 13:147–166.
  43. ^ Т. Печманн (1989). Инкрементное производство речи и референциальное уточнение. Лингвистика, 27:98–110.
  44. ^ П. Энгельхардт, К. Г. Д. Бейли, Ф. Феррейра (2006). Соблюдают ли ораторы и слушатели Грайсовский Максим количества? Журнал памяти и языка, 54:554–573.
  45. ^ К. ван Деемтер, И. ван дер Слуис, А. Гатт (2006). Создание семантически прозрачного корпуса для генерации ссылающихся выражений. В материалах 4-й Международной конференции по генерации естественного языка (INLG), страницы 130–132, Сидней.
  46. ^ В. В. Чейф (1980). Грушевые истории: когнитивные, культурные и лингвистические аспекты нарративного производства. Ablex, Норвуд, Нью-Джерси.
  47. ^ А. Андерсон, М. Бейдер, Э. Гурман Бард, Э. Бойл, Дж. Доэрти, С. Гаррод, С. Айсард, Дж. Ковтко, Дж. Макаллистер, Дж. Миллер, С. Сотилло, Х. Томпсон, Р. Вайнерт (1991). Корпус задач карты HCRC. Язык и речь, 34:351–366.
  48. ^ Б. Ди Эухенио, П. У. Джордан, Р. Х. Томасон, Дж. Д. Мур (2000). Процесс согласования: эмпирическое исследование компьютерных диалогов между человеком и человеком. Международный журнал человеко-компьютерных исследований, 53:1017–1076.
  49. ^ П. Горняк, Д. Рой (2004). Обоснованная смысловая композиция для визуальных сцен. Журнал исследований искусственного интеллекта, 21:429–470.
  50. ^ Дж. Виетен, Р. Дейл (2006). Алгоритмы генерации ссылающихся выражений: делают ли они то, что делают люди ?. Материалы 4-й Международной конференции по генерации естественного языка (INLG), страницы 63–70, Сидней.
  51. ^ а б А. Гатт, И. ван дер Слуис, К. ван Деемтер (2007). Оценка алгоритмов генерации ссылающихся выражений с использованием сбалансированного корпуса. Материалы 11-го Европейского семинара по генерации естественного языка (ENLG), страницы 49–56, Schloss Dagstuhl.
  52. ^ Л. Р. Дайс (1945). Меры степени экологической связи между видами. Экология, 26:297–302.
  53. ^ Р. Пассонно (2006). Соглашение об измерениях по многозначным элементам (MASI) для семантической и прагматической аннотации. Труды 5-й Международной конференции по языковым ресурсам и оценке (LREC), страницы 831–836, Генуя.
  54. ^ Гатт, Белз, Э Ков (2008). TUNA Challenge 2008: Обзор и результаты оценки. Материалы 5-й Международной конференции по генерации естественного языка (INLG), страницы 198–206, Salt Fork, OH.
  55. ^ К. Папинени, С. Рукос, Т. Уорд, В. Чжу (2002). BLEU: метод автоматической оценки машинного перевода. Материалы 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), страницы 311–318, Филадельфия, Пенсильвания.
  56. ^ Дж. Доддингтон (2002). Автоматическая оценка качества машинного перевода с использованием статистики совпадения n-граммов. Труды 2-й Международной конференции по исследованиям технологий человеческого языка (HLT), страницы 138–145, Сан-Диего, Калифорния.
  57. ^ Белз, Гатт (2008). Внутренние и внешние меры оценки для генерации ссылающегося выражения. Материалы 46-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), Колумбус, Огайо.