?

Log in

No account? Create an account

March 22nd, 2013

Длительный полутрезвый образ жизни в буддистской стране вызывает галлюцинации, будит фантазии, рождает необыкновенные сновидения.

Сижу, пишу себе заметки на память, барабаню по клавишам ноутбука, никого не трогаю. Вдруг, слышу за спиной голос: «в этом месте хорошо было бы развить мысль о том, что самый главный враг человека – это он сам». Оборачиваюсь, спрашиваю: «ты хто такой?». Никого нет… Чудеса.

Через пару дней чудо повторилось и голос нервно заметил: «а вот так выражать свою мысль некорректно, это нарушает уже давно известный принцип Беспричинной Причинности, взятый Томасом из Аквино в качестве доказательства существования Бога». Оборачиваюсь – снова никого.

Что за бред? Еще через пару дней я, кажется, нашел ответ.

За время своего развития с появлением письменности человечество накопило гигантский корпус всевозможных текстов, описывающих события, мысли, чувства и знания. Эти тексты написаны на множестве языков, некоторые из которых уже утеряны.

С точки зрения статистики полный корпус текстов представляет собой гигантский статистический ансамбль событий, устроенный согласно своим внутренним законам развития, роста, возникновения новых или исчезновения отдельных частей ансамбля. Т.е., было бы ошибочным считать, что в корпусе текстов каждый отдельный экземпляр является независимым. Он не более независим от всех остальных представителей своего класса, чем какой-нибудь подвид живой природы независим от остальных ее представителей. Ситуация с текстами на сегодня представляет собой не столько ботанику до классификации Карла Линнея, а скорее биологию без знания о генетических связях между отдельными особями.

Другой пример – аналогия с устройством мозга (или памяти). То, что делает сознание человека или животного уникальным – это миллиарды связей между отдельными элементами памяти.

Человечество по мере пополнения корпуса текстов неизбежно сталкивается с проблемой его систематизации. Частично, эта задача решается составлением библиотечных каталогов. Но это лишь малая часть истории. Даже при наличии подробной видовой классификации текстов, мы мало, что знаем, насколько один из представителей своей категории генетически далек от другого, насколько каждый следующий отличается новизной. Частично эту проблему пытаются решить внутри института цитирования, но каждый раз то, насколько качественно проделано цитирование, целиком зависит от квалификации автора текста.

Вся проблема сводится к отсутствию «межтекстовых связей».

Равно так же, как сознание человека качественно отличается от устройства памяти современной вычислительной машины, корпус текстов с установленными межтекстовыми связями между отдельными своими представителями принципиально отличается от даже самого продвинутого библиотечного каталога. Иными словами, реконструкция межтекстовых связей принесла бы человечеству новый качественный уровень знаний, на порядки более эффективный процесс обучения и гораздо более экономичный способ дальнейшего развития.

Межтекстовая связь аналогично генетической связи позволяет судить о том, насколько два текста отличны друг от друга. Поскольку, лингвистика, в частности, связывает выражение мыслей с их текстовым представлением, то генетический код каждого отдельного текста в первую очередь следует искать в чередовании его слов и букв - задачка под силу современной вычислительной технике. Изучая частоту появления похожих сочетаний слов в двух текстах, можно определить степень их различия. Для достаточно больших текстов в силу действия закона больших чисел, такое, казалось бы, примитивно механистическое определение степени родства текстов, неизбежно приводит к установлению степени схожести и изложенных в этих текстах мыслей.


Подобно тому, как сегодня компьютерные редакторы текста подсказывают правильное написание слов, точно так же интеллектуальный текстовой редактор, основанный на постронгии межтекстовых связей, поможет при написании любого нового текста. Тогда редакторами этого текста, или лучше сказать собеседниками автора, станут все те кто до тебя оставил в истории аналогичные мысли, обличенные в текстовую форму, «от Ромула до наших дней».


В качестве послесловия сиюминутного практического приложения.

Наиболее рельефно эффект (негативный) отсутствия связей между отдельными текстами проявился в истории с научными диссертациями. Изначально, по идее, каждая диссертация –это отдельная новая научная работа, а докторская – новое научное направление. Т.е., с точки зрения новизны, два диссертационных текста, написанные даже по одной тематике, обязаны значительно отличаться друг от друга. Степень их отличия определяется свойствами их межтекстовой связи. Для диссертационного текста, встроенного в плотную сеть других академических текстов, была бы невозможной ситуация, в которой этот текст не отличался бы новизной, а зачастую даже копировал бы предыдущие тексты.

Более того, диссертационные тексты, по традиции, достаточно объемны для того, чтобы на их примере заработали законы статистики, и даже простой сравнительный лингвистический анализ их текстов позволил бы построить шкалу их относительной новизны.

В действительности же оказалось, что в ряде вполне конкретных случаев ни о какой относительной новизне мысли в текстах научных трудов речь не идет. Этот интересный опыт полностью «заглушает» паразитный эффект от текстов, которые являются почти точными копиями других текстов, хотя, по идее, являться таковыми не должны. Поэтому, спускаясь от красивой начальной идеи к ужасающей реальности, необходимо в первую очередь подготовить чистый ансамбль академических текстов, вычистив тексты, полные банальных заимствований.

…Тогда, из бамбуковой рощицы напротив покажутся и Лев Толстой и Фома Аквинский -- только успевай фильтровать их базар.

Profile

Golden Gate
afrikanbo
Андрей Ростовцев

Latest Month

July 2014
S M T W T F S
  12345
6789101112
13141516171819
20212223242526
2728293031  

Tags

Powered by LiveJournal.com
Designed by Michael Rose