WikiDer > Лингвистически связанные открытые данные
В обработка естественного языка, лингвистика, и соседние поля, Лингвистические связанные открытые данные (LLOD) описывает метод и междисциплинарное сообщество, занимающееся созданием, совместным использованием и (повторным) использованием языковых ресурсов в соответствии с Связанные данные принципы. В Лингвистически связанное облако открытых данных была задумана и поддерживается Рабочей группой по открытой лингвистике (OWLG) Фонд открытых знаний, но был центром внимания нескольких W3C сообщества, исследовательские проекты и инфраструктура с тех пор.
Определение и развитие
Linguistic Linked Open Data описывает публикацию данных для лингвистики и обработки естественного языка с использованием следующих принципов:[1]
- Данные должны быть открыто лицензированы с использованием таких лицензий, как Creative Commons лицензии.
- Элементы в наборе данных должны быть однозначно идентифицированы с помощью URI.
- URI должен разрешиться, чтобы пользователи могли получить доступ к дополнительной информации с помощью веб-браузеров.
- Разрешение ресурса LLOD должно возвращать результаты с использованием веб-стандарты такой как Структура описания ресурсов (RDF).
- Ссылки к другим ресурсам должны быть включены, чтобы помочь пользователям открывать новые ресурсы и обеспечивать семантику.
Основные преимущества LLOD были определены как:[2]
- Представление: Связанные графы - более гибкий формат представления лингвистических данных.
- Совместимость: общие модели RDF могут быть легко интегрированы.
- Федерация: данные из нескольких источников можно легко объединить.
- Экосистема: Инструменты для RDF и связанных данных широко доступны по лицензиям с открытым исходным кодом.
- Выразительность: существующие словари помогают выразить лингвистические ресурсы.
- Семантика: общие ссылки выражают то, что вы имеете в виду.
- Динамичность: веб-данные можно постоянно улучшать.
Домашняя страница облачной диаграммы LLOD находится на linguistic-lod.org[3]
Словари LLOD
Помимо сбора метаданных и создания облачной диаграммы LLOD, сообщество LLOD стимулирует разработку стандартов сообщества в отношении словарей, метаданных и рекомендаций передового опыта.
Согласно современному обзору Cimiano et al. (2020),[4] к ним относятся:
- для моделирования лексических ресурсов
- ОнтоЛекс-Лимон, стандарт сообщества для лексических ресурсов (машиночитаемые словари, многоязычная терминология, лексикализация онтологий)[5]
- для моделирования лингвистических аннотаций (в корпусах или NLP)
- Веб-аннотация, стандарт W3C для аннотации веб-ресурсов (текстовых или иных)[6]
- Формат обмена NLP (NIF), стандарт сообщества для грамматической аннотации текста[7]
- CoNLL-RDF, словарь на основе NIF для представления RDF корпусов в обычных форматах TSV (CoNLL)[8]
- POWLA, словарь общих лингвистических структур данных, который можно использовать для дополнения NIF, CoNLL-RDF или веб-аннотаций.[9]
- для категорий лингвистических данных
- Онтологии лингвистической аннотации (OLiA) для лингвистической аннотации[10]
- lexinfo для грамматических и других особенностей лексических ресурсов[11]
- для определения языка
- как строки с языковыми тегами, используя Языковые теги IETF BCP 47
- с ISO 639-3 URI, предоставленные lexvo.org[12]
- с Glottolog URI для языковых разновидностей, не охваченных ISO 639
- для метаданных
- Дублинское ядро, стандарт терминов сообщества, который можно использовать для описания веб-ресурсов.
- Словарь каталогов данных (DCAT), стандарт W3C для каталогов данных, опубликованных в Интернете.[13]
- METASHARE-OWL, словарь для метаданных языковых ресурсов[14]
По состоянию на середину 2020 года над большинством этих стандартов сообщества активно ведется работа. Особенно проблематичным является существование нескольких несовместимых стандартов для лингвистических аннотаций, и в начале 2020 года группа сообщества W3C, связанная с языковыми технологиями, начала работать над консолидацией этих (и других) словарей для лингвистических аннотаций в Интернете.[15]
Сообщество
Облачная диаграмма LLOD была разработана и поддерживается Рабочей группой по открытой лингвистике (OWLG) Фонд открытых знаний (с 2014 г. Open Knowledge), открытый и междисциплинарный эксперт в области языковых ресурсов.
OWLG организует общественные мероприятия и координирует разработки LLOD и способствует междисциплинарному взаимодействию между участниками и пользователями LLOD.
Несколько бизнес-групп и общественных групп W3C сосредоточены на специализированных аспектах LLOD:
- Группа сообщества W3C Ontology-Lexica (ОнтоЛекс) разрабатывает и поддерживает спецификации машиночитаемых словарей в облаке LLOD.
- Группа сообщества W3C Best Practices for Multilingual Linked Open Data собирает информацию о передовых методах создания многоязычных связанных открытых данных.[16]
- Группа сообщества W3C Linked Data for Language Technology собирает примеры пользователей и требования для приложений языковых технологий, использующих связанные данные.[17]
Развитие LLOD продвигается вперед и задокументировано в серии международных семинаров, дататонов и связанных публикаций. Среди прочего, к ним относятся
- Связанные данные в лингвистике (LDL), ежегодный научный семинар, начался в 2012 г.
- Многоязычные связанные открытые данные для предприятий (MLODE), проводимое раз в два года собрание сообщества (2012 и 2014 гг.)
- Summer Datathon on Linguistic Linked Open Data (SD-LLOD), проводимый два раза в год, с 2015 г.
Приложения LLOD
Linguistic Linked Open Data применяется для решения ряда научно-исследовательских задач:
- Во всех областях эмпирической лингвистики, компьютерной филологии и обработка естественного языка, лингвистическая аннотация и лингвистическая разметка представляют собой центральные элементы анализа. Однако прогрессу в этой области препятствуют проблемы совместимости, прежде всего различия в словарях и схемах аннотаций, используемых для разных ресурсов и инструментов. Использование связанных данных для подключения языковых ресурсов и онтологии/терминология репозитории облегчают повторное использование общих словарей и их интерпретацию на общей основе.
- В корпусная лингвистика и вычислительная филология, перекрывающаяся разметка представляет собой печально известную проблему для обычных XML форматы. Следовательно, модели данных на основе графов были предложены с конца 1990-х годов.[18] Они традиционно представлены в виде нескольких взаимосвязанных файлов XML (standoff XML),[19] которые плохо поддерживаются стандартной технологией XML.[20] Моделирование таких сложных аннотаций, как Linked Data, представляет собой формализм, семантически эквивалентный standoff XML,[21] но устраняет необходимость в специальной технологии и, вместо этого, полагается на существующую экосистему RDF.
- Многоязычные вопросы, в том числе ссылки на лексические ресурсы, такие как WordNet как это сделано в Межъязыковом указателе Глобальной ассоциации WordNet и объединяет разнородные ресурсы, такие как WordNet и Wikipedia, как это было сделано в BabelNet.
- Обеспечение форумов для стандартизации информации о лингвистических ресурсах
Лингвистические связанные открытые данные тесно связаны с развитием
- лучшие практики для связывания лексических данных в сети (для данных, опубликованных в соответствии с ОнтоЛекс условности)
- лучшие практики для создания аннотации в сети (например, используя Веб-аннотация стандарт)
- лучшие практики для моделирования и обмена текстовыми ресурсами с перекрывающаяся разметка
Избранные исследовательские проекты
Использование и развитие LLOD было предметом нескольких крупномасштабных исследовательских проектов, в том числе
- LOD2. Создание знаний из взаимосвязанных данных (11 стран ЕС + Корея, 2010–2014 гг.)[22]
- МОННЕТ. Многоязычные онтологии сетевых знаний (5 стран ЕС, 2010–2013 гг.)[23]
- ЛИДЕР. Связанные данные как инструмент кросс-медийной и многоязычной аналитики контента для предприятий по всей Европе (5 стран ЕС, 2013–2015 гг.)[24]
- QTLeap. Качественный перевод с использованием подходов глубинной инженерии (6 стран ЕС, 2013–2016 гг.)[25]
- LiODi. Связанные открытые словари (BMBF eHumanities Early Career Research Group, Университет Гете, Франкфурт, Германия, 2015-2020)[26]
- ФРЕМ. Открытая структура электронных услуг для многоязычного и семантического обогащения цифрового контента (6 стран ЕС, 2015-2017)[27]
- ПОЧТОВЫЕ ДАННЫЕ. Стандартизация поэзии и связанные открытые данные (Стартовый грант ERC, UNED, Испания, 2016-2021)[28]
- Linking Latin (грант ERC Consolidator, Universita Cattolica del Sacro Cuore, Италия, 2018-2023 гг.)[29]
- Pret-a-LLOD (5 стран ЕС, 2019-2021)[30]
- NexusLinguarum. Европейская сеть веб-ориентированной лингвистической науки о данных (COST Action, 35 стран COST, 2 соседних страны, одна международная страна-партнер, 2019-2023) [31]
Избранные ресурсы
По состоянию на октябрь 2018 года 10 наиболее часто связываемых ресурсов на диаграмме LLOD (в порядке количества связанных наборов данных):
- В Онтологии лингвистической аннотации (OLiA, связанный с 74 наборами данных) предоставляет справочную терминологию для лингвистических аннотаций и грамматических метаданных;
- WordNet (связана с 51 набором данных), лексическая база данных для английского языка и сводная база данных для разработки аналогичных баз данных для других языков, с несколькими редакциями (версия Princeton связана с 36 наборами данных; версия W3C связана с 8 наборами данных; версия VU связана с 7 наборами данных);
- DBpedia (связана с 50 наборами данных) многоязычная база общих знаний о мире, основанная на Википедии;
- lexinfo.net (связанный с 36 наборами данных) предоставляет справочную терминологию для лексических ресурсов;
- BabelNet (связано с 33 наборами данных) многоязычный лексикализованный семантическая сетьна основе объединения различных других ресурсов, в первую очередь WordNet и Wikipedia;
- lexvo.org (связанный с 26 наборами данных) предоставляет идентификаторы языков и другие данные, связанные с языком. Что наиболее важно, lexvo обеспечивает представление RDF ISO 639-3 3-буквенные коды для идентификаторов языков и информации об этих языках;
- В ISO 12620 Реестр категорий данных (ISOcat; версия RDF, связанный с 10 наборами данных) предоставляет частично структурированный репозиторий для различной терминологии, связанной с языком. Хостинг ISOcat находится в The Language Archive, соответственно, ДОБЫ проект, в Институт психолингвистики Макса Планка, но в настоящее время переходит на Кларин;
- UBY (Версия RDF лимон-Убы, связанный с 9 наборами данных), лексическая сеть для английского языка, собранная из различных лексических ресурсов;
- Glottolog (связанный с 7 наборами данных) предоставляет детальные идентификаторы языков для языков с ограниченными ресурсами, в частности, для многих, не охваченных lexvo.org;
- Викисловарь-DBpedia ссылки (wiktionary.dbpedia.org, связанная с 7 наборами данных), лексикализация концепций DBpedia на основе викисловаря.
Аспекты
Существует ряд повторяющихся дискуссий относительно различных аспектов этого термина, его применимости и для определенного типа ресурсов.[32]
Лингвистические данные: объем и классификация
Помимо ресурсов, используемых и созданных для лингвистических исследований, облачная диаграмма LLOD также включает онтологии, терминологию и общие базы знаний, разработка которых изначально не была вызвана интересом к языковым наукам или языковым технологиям, например, DBpedia. В качестве критерия для включения в диаграмму LLOD OWLG требует «лингвистической релевантности»: «[A] набор данных лингвистически релевантен, если он предоставляет или описывает языковые данные, которые могут использоваться в целях лингвистических исследований или обработки естественного языка».[33] Сюда входят лингвистические ресурсы в строгом смысле слова («условие 1»: аннотированный или иным образом структурированный ресурс, созданный для применения в лингвистических науках или языковых технологиях, как продемонстрировано, например, научной публикацией в журнале или конференции, посвященной лингвистике) , но также и ресурсы, "которые могут использоваться для аннотирования, обогащения, извлечения или классификации языковых ресурсов ... [если их актуальность] может быть подтверждена наличием связей между ресурсом (лингвистическая релевантность которого должна быть подтверждена) и ресурсами, выполняющими условие (1) »(« условие 2 »).[34]
Связанный с этим вопрос - это классификация лингвистически релевантных наборов данных (или языковых ресурсов в целом). Группа OWLG разработала следующую классификацию облачной диаграммы LLOD:[35]
- корпус: лингвистически проанализированный набор языковых данных
- лексиконы: лексико-концептуальные данные
- лексические ресурсы: лексиконы и словари
- терминологическая база: терминология, тезаурусы и базы знаний
- метаданные
- метаданные лингвистических ресурсов (метаданные о языковых ресурсах, включая цифровые языковые ресурсы и печатные книги)
- категории лингвистических данных (метаданные о лингвистической терминологии, в т.ч. лингвистические категории, языковые идентификаторы)
- типологические базы данных (метаданные об отдельных языках, особенно о лингвистических особенностях этих языков)
- другое (заполнитель для ресурсов, которые (пока) не классифицированы)[1]
Обратите внимание, что в этой классификации терминологические базы находятся на грани лингвистической значимости, поскольку они обычно создаются для целей, отличных от языковых технологий или лингвистических исследований.
Открытые данные: доступность
LLOD определяется в отношении связанных открытых данных, и Ресурсы LLOD (данные) должны соответствовать лицензиям в соответствии с Открытое определение.[36] Однако для генерации облачной диаграммы LLOD (и диаграммы LOD) это, похоже, еще не применяется, поэтому техническим критерием является доступность через Интернет и запись метаданных. В OWLG неоднократно обсуждалось, могут ли быть включены некоммерческие (академические) ресурсы, с общим согласием принять их на данный момент (2015 г.), но с последующим введением более строгих требований вместе с ростом облака LLOD. По состоянию на январь 2018 года еще не было согласовано, когда этот шаг должен был произойти.[37] По состоянию на январь 2020 года машиночитаемые метаданные лицензий были доступны для 86 ресурсов LLOD, из них 82 приняты открытые лицензии, 4 приняты некоммерческие лицензии.[38]
В более широком смысле термин Технология LLOD (инфраструктуры, инструменты, словари) также могут использоваться для обозначения технологии независимо от того, задействованы ли на самом деле открытые ресурсы, например, от имени проекта ЕС. Pret-a-LLOD который включает несколько коммерческих бизнес-кейсов.[39] Это оправдано для приложений, которые потребляют (а не предоставляют) открытые данные, но, более того, также, когда технология связанных данных и принятие других соглашений LLOD (в частности, использование словарей RDF, разработанных в контексте LLOD), применяются по порядку. для облегчения бесшовной интеграции Ресурсы LLOD (открытые ресурсы).
Аббревиатура «LLOD» может использоваться для обозначения либо технологии LLOD (использование словарей связанных данных и LLOD, независимо от правового статуса обрабатываемых данных), либо ресурсов LLOD (открытых данных). Для устранения неоднозначности могут использоваться термины «ресурсы LLOD» и «технология LLOD». Чтобы подчеркнуть применение или применимость к закрытым ресурсам, также использовались "LLD" (лингвистические связанные данные).[40] Возможный компромисс - это аббревиатура технологии LL (O) D. Облако «лицензированных лингвистических связанных данных», которое содержит закрытые ресурсы, в настоящее время (июнь 2020 г.) не существует.[41]
Связанные данные: форматы
Определение связанных данных требует применения RDF или связанных стандартов. Сюда входят рекомендации W3C: SPARQL, Turtle, JSON-LD, RDF-XML, RDFa и т. Д. Однако в языковых технологиях и языковых науках в настоящее время более популярны другие формализмы, и включение таких данных в облачную диаграмму LLOD имеет время от времени запрашивались.[32] Для нескольких таких языков существуют стандартизированные W3C механизмы упаковки (например, для XML, CSV или реляционные базы данных, см. Извлечение знаний # Извлечение из структурированных источников в RDF), и такие данные могут быть интегрированы при условии, что соответствующее отображение предоставляется вместе с исходными данными.
Избранная литература
Исчерпывающее описание современного состояния LLOD предоставлено
- Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, генерация и приложения. Springer International Publishing
Концепция облака открытых лингвистических данных была первоначально введена
- Чаркос, Кристиан, Хеллманн, Себастьян и Нордхофф, Себастьян (2011). На пути к облаку связанных открытых данных с лингвистической связью: Рабочая группа по открытой лингвистике. TAL (Traitement Automatique des Langues), 52(3), 245-275.
Первая книга по теме
- Кристиан Кьяркос, Себастьян Нордхофф и Себастьян Хеллманн (ред., 2012 г.). Связанные данные в лингвистике. Представление и соединение языковых данных и языковых метаданных. Спрингер, Гейдельберг.
Согласно Cimiano et al. (2020),[42] другие основополагающие публикации с тех пор включают
- Кристиан Чиаркос, Стивен Моран, Пабло Н. Мендес, Себастьян Нордхофф и Ричард Литтауэр. Создание связанного облака открытых данных лингвистических ресурсов: мотивация и разработки. В Ирине Гуревич и Юнги Ким (ред.) «Народная сеть встречается с НЛП». Совместно созданные языковые ресурсы, Спрингер, Гейдельберг, 2013.
- Кристиан Чиаркос, Джон МакКрэй, Филипп Чимиано и Кристиан Феллбаум. К открытым данным для лингвистики: лексические связанные данные. В Алессандро Олтрамари, Пике Фоссен, Лу Цинь и Эдуард Хови (ред.), Новые направления исследований в онтологиях и лексических ресурсах. Спрингер, Гейдельберг, 2013.
- Хорхе Грасиа, Елена Монтьель-Понсода, Филипп Чимиано, Асунсьон Гомес-Перес, Поль Буйтелаар и Джон МакКрэй. Проблемы многоязычной сети данных // Журнал веб-семантики, т. 11. С. 63–71. Эльзевир Б.В., 2012.
События с 2015 по 2019 год обобщены в сборнике
- Пареха-Лора, Антонио; Похоть, Барбара; Блюм, Мария; Chiarcos, Christian (ред., 2020). Разработка лингвистических связанных ресурсов открытых данных для совместных исследований с большим объемом данных в лингвистических науках. MIT Press
Рекомендации
- ^ а б Открытая рабочая группа по лингвистике. «Лингвистический LOD». linguistic-lod.org. ЛИДЕР проект. Получено 2016-05-24.
- ^ Чиаркос, Кристиан; Маккрэй, Джон; Чимиано, Филипп; Феллбаум, Кристиана (2013). На пути к открытым данным для лингвистики: лексические связанные данные (PDF). Гейдельберг: В: Алессандро Ольтрамари, Пик Фоссен, Лу Цинь и Эдуард Хови (ред.), Новые направления исследований в онтологиях и лексических ресурсах. Springer. Получено 2016-05-24.
- ^ «Открытые лингвистические данные. Информация о текущем состоянии растущего облака связанных между собой открытых данных». Получено 10 декабря 2019.
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, создание и применение. Издательство Springer International. ISBN 978-3-030-30224-5.
- ^ «Модель лексики для онтологий: отчет сообщества, 10 мая 2016 г.». www.w3.org. Получено 2020-06-05.
- ^ «Результаты рабочей группы W3C по веб-аннотациям». w3c.github.io. Получено 2020-06-05.
- ^ Хеллманн, Себастьян; Леманн, Йенс; Ауэр, Сорен; Брюммер, Мартин (2013). Алани, Харит; Кагал, Лалана; Фокуэ, Ахилл; Грот, Пол; Биманн, Крис; Паррейра, Жозиан Ксавьер; Аройо, Лора; Ной, Наташа; Велти, Крис (ред.). «Интеграция НЛП с использованием связанных данных». Семантическая сеть - ISWC 2013. Конспект лекций по информатике. Берлин, Гейдельберг: Springer: 98–113. Дои:10.1007/978-3-642-41338-4_7. ISBN 978-3-642-41338-4.
- ^ Чиаркос, Кристиан; Фет, Кристиан (2017). Грация, Хорхе; Бонд, Фрэнсис; McCrae, John P .; Буйтелаар, Пол; Чиаркос, Кристиан; Хеллманн, Себастьян (ред.). «CoNLL-RDF: связанные корпуса, созданные с учетом требований НЛП». Язык, данные и знания. Конспект лекций по информатике. Чам: Издательство Springer International: 74–88. Дои:10.1007/978-3-319-59888-8_6. ISBN 978-3-319-59888-8.
- ^ Chiarcos, Кристиан (2012). Симперл, Елена; Чимиано, Филипп; Polleres, Аксель; Корчо, Оскар; Пресутти, Валентина (ред.). "POWLA: Моделирование лингвистических корпусов в OWL / DL". Семантическая сеть: исследования и приложения. Конспект лекций по информатике. Берлин, Гейдельберг: Springer: 225–239. Дои:10.1007/978-3-642-30284-8_22. ISBN 978-3-642-30284-8.
- ^ Чиаркос, Кристиан; Сухарева, Мария (01.01.2015). «OLiA - Онтологии лингвистической аннотации». Семантическая сеть. 6 (4): 379–386. Дои:10.3233 / SW-140167. ISSN 1570-0844.
- ^ Cimiano, P .; Buitelaar, P .; McCrae, J .; Синтек, М. (01.03.2011). «LexInfo: декларативная модель для интерфейса лексикон-онтология». Журнал веб-семантики. 9 (1): 29–51. Дои:10.1016 / j.websem.2010.11.001. ISSN 1570-8268.
- ^ де Мело, Жерар (01.01.2015). «Lexvo.org: информация о языке для облака связанных лингвистических данных». Семантическая сеть. 6 (4): 393–400. Дои:10.3233 / SW-150171. ISSN 1570-0844.
- ^ "Словарь каталога данных (DCAT) - Версия 2". www.w3.org. Получено 2020-06-05.
- ^ McCrae, John P .; Лабропулу, Пенни; Грация, Хорхе; Виллегас, Марта; Родригес-Донсель, Виктор; Чимиано, Филипп (2015). Гандон, Фабьен; Гере, Кристоф; Виллата, Серена; Бреслин, Джон; Фарон-Цукер, Кэтрин; Циммерманн, Антуан (ред.). «Одна онтология, которая связывает их всех: онтология META-SHARE OWL для взаимодействия наборов лингвистических данных в Интернете». Семантическая сеть: события-сателлиты ESWC 2015. Конспект лекций по информатике. Чам: Издательство Springer International: 271–282. Дои:10.1007/978-3-319-25639-9_42. ISBN 978-3-319-25639-9.
- ^ ld4lt / лингвистическая аннотация, ld4lt, 2020-05-19, получено 2020-06-05
- ^ «Лучшие практики для многоязычной группы сообщества связанных открытых данных». Получено 9 декабря 2019.
- ^ «Связанные данные для группы сообщества языковых технологий». Получено 9 декабря 2019.
- ^ Птица, Стивен; Либерман, Марк. «К формальной структуре лингвистических аннотаций» (PDF). В: Материалы Международной конференции по обработке разговорной речи, Сидней, 1998 г.. Получено 2016-05-25.[постоянная мертвая ссылка]
- ^ ISO 24612: 2012. «Управление языковыми ресурсами - структура лингвистических аннотаций (LAF)». ISO. Получено 2016-05-25.
- ^ Эккарт, Ричард (2008). Выбор базы данных XML для лингвистически аннотированных корпусов. SDV. Sprache und Datenverarbeitung 32.1 / 2008: Международный журнал по обработке языковых данных, семинар Datenbanktechnologien für hypermediale linguistische Anwendungen (KONVENS 2008), Universitätsverlag Rhein-Ruhr, Берлин, сентябрь 2008 г., стр. 7–22.
- ^ Чаркос, Кристиан. «Взаимодействие корпусов и аннотаций (черновая версия)» (PDF). В: Кристиан Кьякос, Себастьян Нордхофф и Себастьян Хеллманн (ред.) Связанные данные в лингвистике. Представление и соединение языковых данных и языковых метаданных, 2012 г.. Получено 2016-05-25.
- ^ "lod2.okfn.org (заархивированная версия)". Архивировано из оригинал 7 марта 2014 г.. Получено 9 декабря 2019.
- ^ «Многоязычные онтологии для сетевых знаний (Monnet)». Европейская комиссия, результаты исследования CORDIS EU. Получено 10 декабря 2019.
- ^ «LIDER: связанные данные как инструмент кросс-медийной и многоязычной аналитики контента для предприятий по всей Европе». Европейская комиссия, результаты исследования CORDIS EU. Получено 10 декабря 2019.
- ^ «Качественный перевод с использованием подходов глубинной инженерии». Европейская комиссия, результаты исследования CORDIS EU. Получено 10 декабря 2019.
- ^ «Связанные открытые словари (LiODi)». Получено 10 декабря 2019.
- ^ «Открытая структура электронных услуг для многоязычного и семантического обогащения цифрового контента». Получено 10 декабря 2019.
- ^ «POSTDATA - Стандартизация поэзии и связанные открытые данные». Получено 10 декабря 2019.
- ^ "Linking Latin. Создание базы знаний о лингвистических ресурсах для латыни". Получено 10 декабря 2019.
- ^ "Домашняя страница проекта Pret-a-LLOD". Получено 10 декабря 2019."Pret-a-LLOD". Европейская комиссия, результаты исследования CORDIS EU. Получено 10 декабря 2019.
- ^ «CA18209 - Европейская сеть лингвистических данных, ориентированных на Интернет». Стоимость. Европейское сотрудничество в области науки и технологий. Получено 10 декабря 2019.
- ^ а б Историю этих обсуждений см. В архивах списков рассылки Open Linguistics, доступных только в качестве резервной копии в разделе https://github.com/open-linguistics/linguistics.okfn.org/tree/master/backup
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, создание и применение. Издательство Springer International. п. 33. ISBN 978-3-030-30224-5.
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, создание и применение. Издательство Springer International. С. 33–34. ISBN 978-3-030-30224-5.
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, генерация и приложения. Издательство Springer International. стр. 36f. ISBN 978-3-030-30224-5.
- ^ Кьякос, Кристиан и Пареха-Лора, Антонио (2020), Открытые данные - Связанные данные - Связанные открытые данные - Лингвистические связанные открытые данные (LLOD): общее введение. В: Пареха-Лора, Антонио; Похоть, Барбара; Блюм, Мария; Chiarcos, Christian (ред.). Разработка лингвистических связанных ресурсов открытых данных для совместных исследований с большим объемом данных в области языковых наук. MIT Press, стр. 1-18.
- ^ "linguistics.okfn.org/003004.html в магистратуре · open-linguistics / linguistics.okfn.org · GitHub". Получено 2020-06-05.
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, генерация и приложения. Издательство Springer International. п. 37. ISBN 978-3-030-30224-5.
- ^ "Prêt-à-LLOD - сайт проекта Prêt-à-LLOD". Получено 2020-06-05.
- ^ См. Название книги Чимиано, Кьяркос, Грасиа, МакКрэ (2020). Однако аббревиатура LLD (июнь 2020 г .: 7 однозначных совпадений ученых Google), похоже, редко используется по сравнению с LLOD (июнь 2020 г .: 309 однозначных совпадений ученых Google).
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, создание и применение. Издательство Springer International. п. 37. ISBN 978-3-030-30224-5.
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грация, Хорхе (2020). Лингвистические связанные данные: представление, создание и применение. Издательство Springer International. стр. vi. ISBN 978-3-030-30224-5.