WikiDer > Orange (программное обеспечение) - Википедия
Эта статья слишком полагается на Рекомендации к основные источники. (Февраль 2020 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Разработчики) | Люблянский университет |
---|---|
изначальный выпуск | 10 октября 1996 г.[1] |
Стабильный выпуск | 3.27.1[2] / 3 ноября 2020 |
Репозиторий | Оранжевый репозиторий |
Написано в | Python, Cython, C ++, C |
Операционная система | Кроссплатформенность |
Тип | Машинное обучение, Сбор данных, Визуализация данных, Анализ данных |
Лицензия | GPLv3 или новее[3][4] |
Интернет сайт | апельсин |
апельсин является Открытый исходный код визуализация данных, машинное обучение и сбор данных Инструментарий. Он имеет визуальное программирование интерфейс для быстрого поиска и качественного анализ данных и интерактивные данные визуализация.[5]
Описание
Апельсин - компонентный визуальное программирование программный пакет для визуализация данных, машинное обучение, интеллектуальный анализ данных и анализ данных.
Компоненты оранжевого цвета называются виджетами и варьируются от простой визуализации данных, выбора подмножества и предварительной обработки до эмпирической оценки обучения. алгоритмыи прогнозное моделирование.
Визуальное программирование реализуется через интерфейс, в котором рабочие процессы создаются путем связывания предопределенных или разработанных пользователем виджеты, в то время как опытные пользователи могут использовать Orange в качестве библиотеки Python для манипулирования данными и изменения виджетов.[6]
Программного обеспечения
Orange - это программный пакет с открытым исходным кодом, выпущенный под GPL. Версии до 3.0 включают основные компоненты в C ++ с обертки в Python доступны на GitHub. Начиная с версии 3.0, Orange использует стандартные библиотеки Python с открытым исходным кодом для научных вычислений, такие как тупой, странный и scikit-learn, а его графический пользовательский интерфейс работает в кросс-платформенный Qt рамки.
Установка по умолчанию включает ряд алгоритмов машинного обучения, предварительной обработки и визуализации данных в 6 наборах виджетов (данные, визуализация, классификация, регрессия, оценка и неконтролируемый контроль). Дополнительные функции доступны в виде надстроек (биоинформатика, слияние данных и анализ текста).
Orange поддерживается на macOS, Windows и Linux а также может быть установлен из репозитория индекса пакетов Python (pip установить Orange3).
По состоянию на май 2018 года стабильная версия - 3.13 и работает с Python 3, тогда как устаревшая версия 2.7, работающая с Python 2.7, все еще доступна.[7]
Функции
Апельсин состоит из холста интерфейс на который пользователь размещает виджеты и создает рабочий процесс анализа данных. Виджеты предлагают базовые функции, такие как чтение данных, отображение таблицы данных, выбор функций, обучение предикторов, сравнение алгоритмов обучения, визуализация элементов данных и т. Д. Пользователь может интерактивно исследовать визуализации или загружать выбранное подмножество в другие виджеты.
- Холст: графический интерфейс для анализа данных
- Виджеты:
- Данные: виджеты для ввода данных, фильтрации данных, выборки, вменения, манипулирования функциями и выбор функции
- Визуализировать: виджеты для общей визуализации (прямоугольная диаграмма, гистограммы, точечная диаграмма) и многомерной визуализации (мозаичное отображение, решетчатая диаграмма).
- Классифицировать: набор контролируемое машинное обучение алгоритмы классификации
- Регресс: набор контролируемых алгоритмов машинного обучения для регрессии
- Оценивать: перекрестная проверка, процедуры на основе выборки, оценка надежности и скоринг методов прогнозирования
- Без присмотра: обучение без учителя алгоритмы для кластеризация (k-средние, иерархическая кластеризация) и техники проекции данных (многомерное масштабирование, анализ главных компонентов, анализ соответствий).
- Дополнения:
- Партнер: виджеты для майнинга частых наборов элементов и изучение правил ассоциации
- Биоинформатика: виджеты для анализа набора генов, обогащениеи доступ к библиотекам путей
- Слияние данных: виджеты для объединение разных наборов данных, коллективная матричная факторизация и исследование скрытых факторов
- Образовательные: виджеты для обучения концепциям машинного обучения, таким как k-означает кластеризацию, полиномиальная регрессия, стохастический градиентный спуск, ...
- Гео: виджеты для работы с геопространственные данные
- Аналитика изображений: виджеты для работы с изображениями и ImageNet вложения
- Сеть: виджеты для графика и сетевой анализ
- Текстовый анализ: виджеты для обработка естественного языка и интеллектуальный анализ текста
- Временные ряды: виджеты для Временные ряды анализ и моделирование
- Спектроскопия: виджеты для анализа и визуализации (гипер) спектральный наборы данных [8]
Цели
Программа предоставляет платформу для отбора экспериментов, системы рекомендаций, и прогнозного моделирования и используется в биомедицина, биоинформатика, геномное исследование, и обучение. В науке он используется как платформа для тестирования новых алгоритмов машинного обучения и для реализации новых методов в генетика и биоинформатика. В образовании он использовался для обучения методам машинного обучения и интеллектуального анализа данных студентов, изучающих биологию, биомедицину и информатику.
Расширения
Различные проекты основаны на Orange либо путем расширения основных компонентов с помощью надстроек, либо с использованием только Orange Canvas для использования реализованных функций визуального программирования и графического интерфейса.
- OASYS ORange SYnchrotron Suite [9]
- scOrange для биостатистики одиночных клеток
- Квазар для анализа данных в естественных науках
История
- В 1996 г. Люблянский университет и Институт Йожефа Стефана начал разработку ML *, фреймворка машинного обучения в C ++.
- В 1997 г. Python привязки были разработаны для ML *, которые вместе с появляющимися модулями Python сформировали совместную структуру под названием Orange.
- В последующие годы большинство основных алгоритмов интеллектуального анализа данных и машинного обучения были разработаны либо на C ++ (ядро Orange), либо в модулях Python.
- В 2002 году были разработаны первые прототипы для создания гибкого графического пользовательского интерфейса с использованием Pmw Python Megawidgets.
- В 2003 году графический интерфейс пользователя был переработан и переработан для Qt рамки с использованием PyQt Привязки Python. Была определена среда визуального программирования, и началась разработка виджетов (графических компонентов конвейера анализа данных).
- В 2005 году расширения для анализа данных в биоинформатика был создан.
- В 2008, Mac OS X DMG и Финкразработаны установочные пакеты на основе.
- В 2009 году было создано и поддержано более 100 виджетов.
- С 2009 года Orange находится в стадии бета-версии 2.0, и на веб-сайте предлагаются установочные пакеты на основе ежедневного цикла компиляции.
- В 2012 году была введена новая иерархия объектов, заменившая старую модульную структуру.
- В 2013 году произошел серьезный редизайн графического интерфейса.
- В 2015 году выпущен Orange 3.0.
- В 2016 году Orange находится в версии 3.3. В разработке используется ежемесячный стабильный цикл выпуска.
Рекомендации
- ^ "orange3 / CHANGELOG.md на master. biolab / orange3. GitHub".
- ^ «Выпуск 3.27.1». 3 ноября 2020 г.. Получено 16 ноября 2020.
- ^ «Апельсин - Лицензия».
- ^ "orange3 / ЛИЦЕНЗИЯ на master. biolab / orange3. GitHub".
- ^ DemšarJanez; CurkTomaž; ErjavecAleš; GorupČrt; HočevarTomaž; MilutinovičMitar; МожинаМартин; PolajnarMatija; ТоплакМарко; СтаричАнже; ŠtajdoharMiha (01.01.2013). "Апельсин". Журнал исследований в области машинного обучения.
- ^ Янез Демшар; Томаж Церк; Алеш Ерявец; Črt Gorup; Томаж Хочевар; Митар Милутинович; Мартин Можина; Матия Полайнар; Марко Топлак; Анже Старич; Миха Стайдохар; Лан Умек; Лан Жагар; Юре Žbontar; Маринка Житник; Блаж Жупан (2013). «Оранжевый: набор инструментов для интеллектуального анализа данных в Python» (PDF). JMLR. 14 (1): 2349–2353.
- ^ «Апельсин - Скачать». апельсин. Получено 28 мая 2018.
- ^ М. Топлак, Г. Бирарда, С. Рид, К. Сандт, С. Розендаль, Л. Ваккари, Дж. Демшар, Ф. Борондиш, Synchrotron Radiation News 30, 40–45 (2017). https://doi.org/10.1080/08940886.2017.1338424
- ^ Л. Ребуффи, М. Санчес дель Рио, Proc. SPIE 10388, 103880S (2017). https://doi.org/10.1117/12.2274263
дальнейшее чтение
- Демшар, Янез и Блаж Жупан, Апельсин: интеллектуальный анализ данных плодотворен и увлекателен - историческая перспектива, Informatica 37, стр. 55–60, (2013).