Теория лингвистики - 63: Лингвистические проблемы искусственного интеллекта

Теория лингвистики - 63: Лингвистические проблемы искусственного интеллекта

Общие сведения

Лингвистические проблемы искусственного интеллекта неразрывно связаны с историей развития вычислительной техники и эволюцией философских представлений о природе человеческого мышления. Первоначально в научном сообществе доминировало предположение, что вычислительные машины, функционирующие на основе строгой математической логики, автоматически станут воплощением искусственного интеллекта. Проблема создания мыслящей машины формировалась преимущественно в рамках позитивистской парадигмы и научного редукционизма, где сложнейшие процессы человеческого мышления концептуально сводились к набору простейших базовых операций и алгоритмов.

Исторические и философские предпосылки

Фундаментальную логическую основу для будущего создания искусственного интеллекта заложил философ и математик Джордж Буль, исследовавший законы логики и предложивший бинарную систему счисления, оперирующую исключительно нулем и единицей. Впоследствии видные логические позитивисты, в частности Готлоб Фреге и Бертран Рассел, глубоко исследовали взаимосвязь естественного языка и логики. Их теоретические изыскания доказали, что процесс мышления потенциально разложим на совокупность элементарных логических операций, которые могут быть выражены в виде строгих алгоритмов.

Опираясь на эту концептуальную базу, Алан Тьюринг разработал модель универсальной виртуальной машины, способной воспроизводить любые математические и логические алгоритмы. Параллельно, в тридцатые годы двадцатого века, Клод Шеннон продемонстрировал, что релейные электрические цепи способны физически воспроизводить алгебру Буля, тем самым заложив основы современной теории информации. В сороковые годы Джон фон Нейман окончательно сформулировал архитектурные принципы работы компьютера, включая важнейший принцип разделения данных и процедур. В этой архитектуре данные стали рассматриваться как символические структуры, представляющие собой подобие простейшего искусственного языка, которым манипулируют алгоритмические программы.

Эволюция лингвистических подходов

Длительное время считалось, что развитый аппарат математики и формальной логики сам по себе способен обеспечить функционирование искусственного интеллекта. Однако уже к пятидесятым годам двадцатого века, в частности при попытках создания первых систем машинного перевода, стало очевидно, что естественный язык не поддается исчерпывающему описанию исключительно средствами математики. Для решения возникшей проблемы началось активное привлечение профессиональных лингвистов, которые стали разрабатывать математические модели языка в рамках набирающего силу научного направления — когнитивизма.

Американский философ и лингвист Джерри Фодор сформулировал теоретические требования к внутреннему языку, на котором потенциально должна мыслить вычислительная машина. Фодор успешно перенес идеи классического структурализма на искусственный интеллект, утверждая, что внутренние ментальные состояния обладают семантической формой и могут быть расчленены на элементарные составляющие. Подобно тому как человек способен порождать и понимать бесконечное множество ранее не встречавшихся фраз благодаря комбинации конечного числа элементов, искусственный интеллект должен опираться на базовый набор элементарных машинных концептов и строгие правила их комбинирования. Одновременно с этим Ноам Хомский разрабатывал теорию порождающих грамматик, что также внесло существенный вклад в формализацию синтаксических правил языка. Таким образом, в семидесятые годы создание искусственного интеллекта стало рассматриваться не просто как прямой перевод мышления в логический код, а как масштабная задача конструирования специфического внутреннего языка машины.

Проблема контекста и естественного языка

Промежуточным звеном между естественным человеческим языком и аппаратным машинным кодом стали языки программирования. Проектирование языков программирования долгое время оставалось важнейшей прикладной лингвистической и математической задачей. Тем не менее, главной итоговой целью развития вычислительных систем стало обеспечение свободной коммуникации машины и массового пользователя на естественном языке, без необходимости использования специалистов-посредников.

Фундаментальной проблемой на этом пути оказалась зависимость значения любых языковых единиц от широкого контекста. Человек интуитивно присваивает корректные значения многозначным словам, опираясь на весь объем своего жизненного опыта и параметры ситуативного окружения. Вычислительной машине для правильного понимания естественной речи необходимо алгоритмически заложить исчерпывающий контекст. В рамках старых логико-алгоритмических систем создание столь объемного контекстуального аппарата оказалось крайне ресурсоемкой и труднореализуемой задачей.

Современное состояние и сетевые модели

На смену ранним попыткам жестко алгоритмизировать язык с помощью строгих логических функций, характерных для языков программирования вроде Лисп или Пролог, пришел принцип искусственных нейронных сетей, также известный как коннекционизм. Одной из первых экспериментальных систем, реализовавших этот подход, стала архитектура Пандемониум, созданная для базового распознавания образов и символов. В подобных сетевых системах множество независимых программных анализаторов обрабатывают отдельные признаки объекта, затем когнитивные элементы соотносят эти разрозненные признаки с сохраненными эталонами, принимая окончательное вероятностное решение на основе наибольшего совпадения.

В современной компьютерной лингвистике сетевой подход стал абсолютно доминирующим. Замещение линейных детерминированных алгоритмов многослойными обучаемыми нейросетями позволило искусственному интеллекту гораздо точнее улавливать контекстуальные и ассоциативные зависимости слов, имитируя человеческую речевую деятельность. Внедрение массивных языковых генеративных моделей привело к колоссальному прогрессу в способности вычислительных машин создавать связные естественные тексты и вести осмысленный диалог, что в обозримой перспективе открывает путь к полному решению лингвистической проблемы взаимодействия человека и искусственного интеллекта.

См. также

Теория лингвистики - 62

Смотреть видео