Category: компьютеры

Category was added automatically. Read all entries about "компьютеры".

Фантастика отменяется

Незаметная смерть распознавания речи
"Предполагалось, что когда компьютер научится понимать человеческую речь, мы быстро сможем создать искусственный интеллект. Но точность систем распознавания речи достигла своего пика в 1999 году и с тех пор застыла на месте. Академические тесты 2006 года констатируют факт: системы общего профиля так и не преодолели уровень 80%, тогда как у человека этот показатель составляет 96-98%. Программисты сделали всё что смогли, и у них не получилось. Спустя несколько десятилетий они поняли, что человеческая речь — не просто набор звуков. Акустический сигнал не несёт достаточно информации для распознавания текста.

Сложность задачи можно себе представить. По некоторым оценкам, количество возможных предложений в человеческом языке составляет 10 в 570 степени. В документированных источниках зафиксирована лишь малая их часть, так что систему невозможно научить, даже если «скормить» ей все тексты, созданные людьми.У многих слов в языке — сотни или тысячи значений. Выбор конкретного значения зависит от контекста, то есть от окружающих слов. В устной речи он ещё зависит от выражения лица или от интонации.

Наш мозг способен генерировать текст совершенно произвольно, используя интуитивно понятные правила функциональной грамматики и усвоенную с возрастом семантическую парадигму каждого слова. Эти правила описывают, какие слова могут сочетаться друг с другом и каким образом (через какие функциональные элементы). Значение каждого слова зависит от значения предыдущего слова, а в сложных случаях наш мозг распознаёт речь лишь по обрывкам фраз, зная контекст.

Базовые правила функциональной грамматики понятны каждому человеку, но их никак не удаётся формализовать, чтобы стало понятно и компьютеру. А без этого никак. Когда компьютер пытается распознать ранее не встречавшиеся ему предложения, он неизбежно будет допускать ошибки в распознавании, если у него нет грамматического парсера и словаря с семантическими парадигмами, встроенного в человеческий мозг.

Например, российские лингвисты когда-то попытались составить семантическую парадигму одного простого предлога русского языка (кажется, ПРИ). Они дошли до нескольких сотен значений, каждое из которых допускает свой набор последующих элементов. И это был явно не полный список.

По грамматике предлогов проводятся целые научные конференции (некоторые учёные всю жизнь изучают предлог ПО и не могут до конца раскрыть его тайны). А ведь подобное описание требуется для каждой морфемы человеческого языка, включая приставки и суффиксы. Только после этого можно будет приступить к программированию компьютерных систем распознавания речи. По силам ли человечеству эта задача? Ведь нужно учесть ещё, что парадигма каждого элемента человеческой речи постоянно меняется, ведь язык живёт своей жизнью и всё время эволюционирует. Как компьютерная система сможет самообучаться?

Самый поверхностный анализ опубликованных текстов в интернете компанией Google позволил выявить триллион объектов. Это лишь мизерная часть морфем, из которых состоит наша речь. Google выложил 24-гигабайтный архив с текстами во всеобщий доступ и прекратил дальнейшие публикации по этой теме.

Проект MindNet по созданию «универсального парсера» компания Microsoft начала в 1991 году. Они пытались построить универсальную карту всех возможных взаимосвязей между словами. На проект потратили много сил и финансовых средств, но были вынуждены практически прекратить исследования в 2005 году".
https://geektimes.ru/post/92771/

Рождение простоты

Прочитал книжку о последних (2003-2010гг) открытиях в биологии применительно к вопросу о возникновении жизни и эволюции (Марков «Рождение сложности»). Автор так увлекся своей темой и отповедью поповщине («К сожалению, креационистская пропаганда продолжает находить отклик в сердцах многих далеких от биологии людей»), что представил рождение жизни процессом чуть сложнее сборки паровозика из «Лего» вслепую.

Жизнь начала зарождаться еще в протопланетном облаке, сложные молекулы выстраивались в свой ряд не атом к атому а крупными готовыми блоками (что кардинально упрощает процесс), все это происходило под воздействием многочисленных и легкодоступных катализаторов (а не при разрядах молний как у Опарина), жизненные процессы запускались из природных циклов, копирование происходит из природного свойства комплементарности, не ДНК и не белки появились первоначально (что отдельно невозможно а вместе немыслимо) а РНК, совмещающие в себе свойства белков и ДНК (теория РНК-мира, согласно которой первые живые существа были РНК-организмами без белков и ДНК), клетка возникла как симбиоз живых существ, организм – как симбиоз клеток.

Но почему мы тогда одиноки во Вселенной?

Только в Млечном Пути 250 млрд. звезд, около 500 млн. планет по самым скромным подсчетам должны обладать высокоразвитыми цивилизациями, а даже одна «старшая» цивилизация в срок 500 млн. лет способна заселить всю нашу галактику.
А есть еще и другие звездные скопления. С их учетом счет возможных посетителей Земли должен идти на сотни тысяч, следы чужих цивилизаций должны громоздиться один на другой.

Если жизнь – это так просто. Но ее почему то больше нигде нет.

И следуют простые вопросы: если на пространстве микрона происходят такие заурядные вещи как жизнь, а в остальном океане их нет, то заурядна ли жизнь В МАСШТАБЕ океана? Может что-то тут, на Земле, есть особенное?
Или: если жизнь на Земле так заурядна, тогда, получается, ее отсутствия в остальной Вселенной фатально фантастично. Может чего-то там, во Вселенной, нет особенного?

По меньшей мере, одним ли биологам судить о Жизни? Может в союзе с астрономами? Философами? А может и с попами-креационистами? Хотя книжка и интересная.

Кстати, автор-биолог, неожиданно вот что пишет в конце книги, все доказав, про «четкую модель» про то, как работает биологическая система:

«...В действительности все гораздо сложнее. Приходится признать, что аналогии между живыми организмами и искусственными информационными системами, например компьютерами, вошедшие в моду в конце XX века, в значительной степени неправомочны. В отличие от компьютера в живых системах так называемая “информация”, ее носители, а также “устройства” для ее прочтения и реализации оказываются слиты воедино и практически неразделимы. Например, РНК оказывается не только “результатом прочтения” генетического кода и средством передачи информации от ДНК к системе синтеза белка, но и активным участником и регулятором самого процесса “прочтения”, способным менять смысл читаемых “сообщений”. ... Представьте себе текст, умеющий сам себя редактировать, или жесткий диск, который в зависимости от записанных на нем байтов информации приобретает разные физические свойства и активно вмешивается
в работу считывающего устройства — например, заставляет пропустить или повторно прочесть некоторые участки. Или, как в случае с парамутациями, представьте себе, что вы хотите перенести информацию с одного компьютера на другой при помощи дискеты, однако ваша дискета помнит, в каких компьютерах побывала раньше и какие файлы ей там встречались, и на основе этих знаний она начинает по собственному произволу редактировать записанный на ней текст. В итоге до компьютера-“реципиента” вы донесете не то, что скопировали, а нечто совсем иное. Не случайно некоторые ведущие теоретики в настоящее время ставят под сомнение саму применимость понятия “информация” к последовательностям нуклеотидов ДНК и РНК».


«Донесете не то, что скопировали, а нечто совсем иное». Если на такой неточности в итоге жизнь держится (и квантовая физика, кстати), и если познание таких неточностей до конца никак не возможны (ведь знают же, знают!) то как (логически не пойму) ученые могут не допускать мистику, хотя бы в самом финале, там, у «вещи в себе»?

Какое то особое устройство разума. Не понаслышке зная «юридическую деформацию личности», полагаю, что-то в этом роде, и такое же отталкивающее, хотя и полезное для общества. Разумеется, в своей сфере полезное.