22 октября 2019
332

Краткий обзор моделей представления умений при применении методов машинного обучения для предсказания оптимальной образовательной траектории учащегося

Опубликовано в сборнике: 

ПРОБЛЕМНО-ИНФОРМАЦИОННЫЙ ПОДХОД К ИСПОЛЬЗОВАНИЮ СРЕДСТВ СОВРЕМЕННОГО ОБРАЗОВАНИЯ: ВОПРОСЫ ТЕОРИИ И ПРАКТИКИ
Материалы XIV Всероссийской научно-практической конференции с международным участием «Образование на грани тысячелетий». Отв. ред. Л.И. Колесник. Нижневартовск, 2019. С.78-81.
Издательство: Нижневартовский государственный университет (Нижневартовск) 

https://elibrary.ru/item.asp?id=37127214 

 

 

Аннотация

Применение методов машинного обучения для формирования личных образовательных траекторий за счет полной, частичной автоматизации – важное направление в развитии современных цифровых систем. В докладе приводятся модели представления знаний при применении методов машинного обучения для предсказания образовательной траектории учащегося.

Ключевые слова: анализ больших данных, модели представления данных, рекуррентная нейронная сеть, моделирование поведения учащегося, предсказание образовательной траектории, повышение точности предсказания образовательной траектории, образовательная траектория.

В области искусственного интеллекта понятие «знание» часто определяют через понятие «логический вывод», например: «знания – это формализованная информация, на которую ссылаются и которую используют в процессе логического вывода» [1, с. 6]. Однако наиболее конструктивным для создания компьютерных систем является определение категории знания через категорию данных. Наиболее четкое и строгое определение с точки зрения соотношения данных и знаний ввел Д.А. Поспелов, который выделил шесть характеристик, усложняющих данные и превращающие их в знания: внутренняя интерпретируемость, структурированность, связность, шкалирование, семантическая метрика, наличие активности [4, с. 26–27. 10, с. 70–90]. 

В своей статье «Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов» Д.А.Поспелов выделяет следующие задачи, решаемые представлением знаний как ведущим направлением искусственного интеллекта:

«...а) как собрать знания о проблемной области и, в частности, как получить с помощью опроса эти знания от специалистов в данной области; 

б) как представить эти знания в базе знаний в форме, удобной для последующей обработки на ЭВМ; в) как сохранить непротиворечивость и достичь полноты знаний при объединении знаний, получаемых из различных источников; 

г) как классифицировать собранные знания и как обобщать их в процессе накопления; 

д) как их использовать при решении различных задач» [10, с. 70–90]. В свою очередь, Э.В. Попов [9, с. 86–88], а также Э.В.Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот [12, с. 25] особый акцент делают на выделение двух проблем, связанных с представлением знаний: ЧТО представлять и КАК представлять. И подчеркивают, что в искусственном интеллекте основной акцент делался на второй проблеме в ущерб первой; также они отмечают, что эти две проблемы не независимы друг от друга, так как «...в некотором выбранном способе представления невозможно (либо в принципе, либо эффективно) выразить некоторое ЧТО» [11, с. 54].

Первым критерием классификации является концептуальный подход к представлению знаний. При этом можно выделить следующие подходы: символьный (это традиционные модели, такие как фреймы, семантические сети, продукции), коннекционистский подход (нейронные сети), эмерджентный подход (применение принципов эволюции и самоорганизации – эволюционные вычисления, генетические алгоритмы и т.д.; применение моделей социальных систем – решение задачи сообществом интеллектуальных агентов), а также смешанный подход, когда в одной модели объединяются, например, нейронные сети и продукционные системы.

Такое деление не очень принято в отечественной литературе, но, тем не менее, достаточно распространено в иностранной [6, с. 109–111]. Часто в качестве одной из ключевых современных проблем представления знаний называют объединение символьных и коннекционистских подходов. Одной из концепций, объединяющей разные подходы (нечеткую логику, нейронные сети, генетические алгоритмы) является концепция «мягких вычислений» [14, с. 73–77].

Второй критерий связан с понятиями тезауруса и онтологии. А.С. Нариньяни даже ввел аббревиатуру ТЕОН, которая символизирует необходимость объединения этих двух подходов для разработки систем, реализующих в той или иной степени понимание естественного языка.

Как определено Ю.Н. Филипповичем и А.В. Прохоровым в их исследовании «Семантика информационных технологий: Опыты словарно-тезаурусного описания» «...формализацию знаний путем именования предметов и отношений между ними словами-понятиями естественного языка называют тезаурусным описанием, а результаты такого описания – тезаурусами» [13, с. 101]. Иначе говоря, тезаурус можно рассматривать как модель парадигматической структуры плана содержания языка [5, с. 180–182]. Основная идея словаря-тезауруса заключается в том, что он как бы «противоположен» обычному толковому словарю: в толковом словаре вхо-дами являются слова, упорядоченные по тому или иному признаку (обычно по алфавиту), а выходами толкования этих слов; в тезаурусе же все наоборот – входом являются «идеи» («смыслы», «когнитивные области»), упорядоченные тем или иным способом, а выходом – слова, выражающие данные «смыслы» [5, с. 182].  

Что касается онтологии, то единого мнения о том, что это такое, нет. Рассмотрим определения, данные в статье Р. Мизогучи «Шаг в направлении инженерии онтологий» [7, с. 11–37]: 1) онтология –явная спецификация концептуализации; 2) онтология – некоторая теория (совокупность) понятий, или словарь понятий, используемых в качестве строительных кирпичиков систем обработки информации; 3) онтология –соглашение о совместно используемых (shared) концептуализациях. Формально модель онтологии задается следующей тройкой [16, с. 11–37]:

O = (X, R, Ф),

где X –конечное множество концептов предметной области, R –конечное множество отношений между концептами, Ф – конечное множество функций интерпретации, которые задаются на множестве X и/или R.

Третий критерий связан с традиционным делением моделей представления знаний на логические и эвристические, и рассмотрением базовых формализмов представления знаний, таких как семантические сети, логика предикатов, продукции и т.д. 

В логических моделях представления знаний отношения, существующие между отдельными единицами знаний, выражаются исключительно средствами того логико-математического языка, который используется для представления знаний. В основе всех логических моделей лежит понятие формальной логической системы (теории):

M = <T, P, A, F>,

Здесь T –множество базовых элементов, P –множество синтаксических правил, позволяющих строить из T синтаксически правильные выражения, A –множество априорно истинных выражений (аксиом), F –семантические правила или правила вывода, которые используются для формального вывода из аксиом и ранее выведенных истинных выражений других истинных выражений.

Эвристические модели представления знаний, в отличие от логических, имеют разнообразный набор средств, передающих специфические особенности конкретной предметной области [12, с. 117]. Следуя к эвристическим моделям в работе «Статические и динамические экспертные системы» отнесены сетевые, продукционные, фреймовые и объектно-ориентированные модели; также дополнительно добавлен класс специальных эвристических моделей представления знаний –сюда можно отнести, например, алгебраические подходы к представлению знаний [2, с. 52–64].

В основе сетевых моделей лежит понятие сети, образованной помеченными вершинами и дугами; где вершины сети представляют некоторые сущности (объекты, события, процессы, явления), а дуги – семантические отношения между сущностями, которые они связывают (например, отношения «часть-целое», «причина – следствие», «объект –свойство объекта», и многие другие) [12, с. 124].

Фрейм-представления были предложены М. Минским [8, с. 23–26]. Фрейм можно понимать как структуру данных, предназначенную для представления некоторой стандартной, стереотипной ситуации. Каждый фрейм имеет слоты, а каждый слот, в свою очередь, может иметь определенное значение; можно выделять фреймы-прототипы и фреймы-экземпляры, реализуя, таким образом, отношение обобщения / конкретизации. К слотам могут быть привязаны условия, которые должны выполняться, чтобы произошло получение слотом конкретного значения или процедуры, которые вызываются при обращении к слоту для получения его значения, также слоты могут иметь значения по умолчанию. Объектно-ориентированный подход фактически является развитием фреймового; в его основе лежат понятия объекта и класса [12, с. 99–102]. В качестве трех китов, на которых основан объектно-ориентированный подход, или, более конкретно, объектно-ориентированное программирование, часто называют инкапсуляцию, наследование и полиморфизм. Гради Буч выделяет 7 главных элементов объектной модели: абстрагирование, инкапсуляция, модульность, иерархия, типизация, параллелизм, сохраняемость [3, с. 301–322].

В продукционном подходе знания представляются в виде множества правил «ЕСЛИ, ТО». Такое представление знаний для моделирования на компьютере процесса принятия решений первым предложил использовать А. Ньюэлл. 

В архитектуре программных систем продукций традиционно выделяют три основных компонента: базу данных, в которой хранится текущая информация о решаемой задаче; базу знаний –множество продукций; интерпретатор (машину вывода), выполняющий преобразование базы данных на основе продукций с использованием некоторой стратегии вывода [15, с.81].

 

Литература

1. Аванесов В.С. Основы педагогической теории измерений // Педагогические измерения. 2004. No 1. С.15–21.

2. Бениаминов Е.М. Алгебраические методы в теории баз данных и представлении знаний. М.: Научный мир, 2003. 184 с.

3. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на C++, 2-е изд./Пер. с англ. М.: «Издательство Бином», СПб.: «Невский диалект», 2000. 560 с., ил.

4. Достоверный и правдоподобный вывод в интеллектуальных системах / Под ред. В.Н. Вагина, Д.А. Поспелова. М.: ФИЗМАТЛИТ, 2004. 704 с.

5. Кобозева И.М. Лингвистическая семантика: Учебник. Изд. 3-е, стереотипное. М.: КомКнига, 2007. 352 с. (Новый лингвистический учебник).

6. Люгер, Джордж Ф. Искусственный интеллект: стратегии и методы решения сложных проблем, 4-е издание. : Пер. с англ. М.: Издательский дом «Вильямс», 2003. –864 с. : ил..

7. Мизогучи Р. Шаг в направлении инженерии онтологий // Новости искусственного интеллекта. 2000. No 1-2. С. 11–37.

8. Минский М. Фреймы для представления знаний. М.: Энергия, 1979. 152 с. 9. Попов Э.В. Общение с ЭВМ на естественном языке. Изд. 2-е, стереотипное. М.: Едиториал УРСС, 2004. 360 с.

10. Поспелов Д.А. Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов // Новости искусственного интеллекта. 1994. No 4. С. 70–90.

11. Смолин Д.В. Введение в искусственный интеллект: конспект лекций. 2-е изд., перераб. М.: ФИЗМАТЛИТ, 2007. 264 с.

12.Статические и динамические экспертные системы: Учеб. пособие. М.: Финансы и статистика, 1996. 320 с.: ил.

13. Филиппович Ю.Н., Прохоров А.В. Семантика информационных технологий: Опыты словарно-тезаурусного описания. С предисловием А.И.Новикова М.: МГУП, 2002. 368 с.

14. Ярушкина Н.Г. Основы теории нечетких и гибридных систем: Учеб. пособие. М.: Финансы и статистика, 2004. 320 с.

15. Яхно Т.М. Системы продукций: структура, технология, применение. ВЦ РАН, Новосибирск. 1990. 127 с.

16. Soh L.-K., Blank, T. Integrating Case-Based Reasoning and Meta-Learning for a Self-Improving Intelligent Tutoring System // International Journal of Artificial Intelligence in Education. 2008. No 18. P.27–58

Рейтинг всех персональных страниц

Избранные публикации

Как стать нашим автором?
Прислать нам свою биографию или статью

Присылайте нам любой материал и, если он не содержит сведений запрещенных к публикации
в СМИ законом и соответствует политике нашего портала, он будет опубликован