Это сообщение – ответ на комментарий в ЖЖ ( http://neurocod.livejournal.com/17629.html )
nik_ol_a (212.106.51.138) wrote
А что если пойти другим путем и взглянуть в сторону эволюционного алгоритма, то есть естественного отбора, тут все упрется в создание системы, запуска туда множество разных алгоритмов, механизма мутации, механизма отбора и скрещивания признаков, стоит раз запустить систему и остается только наблюдать, направлять (в зависимости от того, что в идеале должно получится) и постепенно, по мере возможности наращивать мощности, если эксперимент пойдет в гору, можно выйти и на уровень суперкомпьютеров… Что нужно? База данных, вычислительная мощность и виртуальная среда, цель (идеальный алгоритм в определенных условиях), множество набросков и «природа» сама создаст ИИ, вернее уже ЕИИ, вообще очень интересная тема… Кстати, не в курсе, проводятся ли подобные опыты в научном мире? Есть подобные идеи (уверен, есть) и как они продвигаются? Гуглил, ничего толком не нашел, кроме прогамки Ameba (разведение виртуальных бойцовых амеб) и статьи на kiberpank.ru. PS. Сразу извиняюсь за корявость изложения, не мой профиль, но очень интересуюсь :)
По поводу предложения рассмотреть генетические алгоритмы. Если предложение в контексте той заметки, «БД промежуточного типа», то основная цель описанного этапа (для меня) – не создание ИИ, а наполнение этой БД информацией, которую ИИ мог бы потом использовать. Взять, к примеру, Википедию. До сих пор, через не один год активного наполнения большим сообществом, по многим статьям содержится очень мало качественной информации. Примеры вопиющих неточностей в русской Википедии рассматривал Александр Венедюхин в своем блоге ( http://dxdt.ru/2009/01/10/1981/ ). А что тогда говорить про семантические БД, в которых количество заносимой информации должно быть на порядки больше? Больше хотя бы потому, что приветствуется охват информации, которая не попадает под критерии отбора в энциклопедию, и потому, что та же самая статья с расшифрованной семантикой будет содержать информации больше, чем обычный текст, семантическая информация в котором сжата и расшифровывается при активном чтении и осмыслении. Понятно, что неплохо было бы начать наполнение таких БД как можно раньше. Но тут возникает вопрос об удобстве. Посмотрите на удобство заполнения викисловаря – в него до сих пор не занесены многие словари, даже при имеющихся соответствующих электронных БД слов в других форматах, из-за трудностей с внесением новой информации в БД викисловаря, переформатирования, необходимости изучения работы ботов-заливщиков, вики-разметки, соответствующих шаблонов. (Не вдаваясь в подробности, викисловарь не в последнюю очередь спровоцировал написание этой заметки).
Или предложение рассмотреть генетические алгоритмы звучало в контексте создания ИИ? «Кстати, не в курсе, проводятся ли подобные опыты в научном мире?» Проводятся – все кому не лень :). Когда-то и я сталкивался с небольшими статьями с описанием нескольких подобных проектов, но ссылки и названия не сохранились. Зато сохранились выводы, сделанные позже.
Зачем нужен суперкомпьютер? Он дает ускорение вычислений на три-четыре десятичных порядка, в сравнении с
домашним компьютером. Всего-то десять-тринадцать двоичных порядков.
Ранее уже упоминался комбинаторный взрыв в вариантах алгоритмов работы и роста ИНС, над которыми я работал. Закономерно возник вопрос – можно ли переложить эту задачу совладания с комбинаторным взрывом на плечи компьютера, эволюционных алгоритмов. Количество вариантов было настолько большим (многие десятки двоичных вариантов, которые перемножаются), что прямой перебор не дал бы полезных результатов. Можно еще использовать правила отбора. А для этого нужно знать, какое поведение ассоциативных семантических ИНС считать идеальным. Что тоже является непростой задачей.
В то же время, научные исследования ИНС за сравнительно короткое время позволяют перебирать двоичные варианты целыми пачками. Это отбор, проводимый человеческим интеллектом. Он позволяет вместо экспоненциального роста количества вариантов и работы по их обору работать с линейным или близкому к линейному ростом количества необходимой работы по отбору. А тогда рассмотренные за год десяток аспектов дают выигрыш, аналогичный переходу от домашнего компьютера к суперкомпьютеру. А за несколько лет НИР выходят астрономические числа «сырых» вариантов, которые не смогли бы перебрать все компьютеры Земли. С другой стороны, с получением опыта, и для перебора компьютеру можно отдавать модели с меньшим количеством перебираемых элементов. Поэтому я счел эволюционные алгоритмы пока относительно неперспективными.