?

Log in

No account? Create an account

Previous Entry | Next Entry

Нам выпало жить в эпоху информационных революций. На каждом новом этапе появляются инструменты, позволяющие существенно более быстрый и удобный способ получения информации. Телевидение, интернет... как только интернет-сеть разрослась до неперевариваемых размеров, появились поисковики, организовались wiki-педии, соцсети и вики-сообщества. Но даже это не спасает от превращения сети в общую помойку, в которой найти достоверную и нужную информацию становится всё труднее. Поэтому, я уверен, что следующий большой скачок в развитии связан ни с чем иным, а с интеллектуальными анализаторами текстов. Это большая тема, включающая в себя и автопереводчиков с одного языка на другой, и анализ многих текстов, основанный на их сравнении друг с другом...

Как это работает уже сегодня на примере модной темы "написание диссертаций" интересно с методологической точки зрения разобрать на конкретном примере. Сразу скажу, что пример этот хоть и основан на реальных фактах, но не имеет своей целью никого скомпрометировать или в чем-то обвинить. Чисто наука о нарождающихся "интеллектуальных анализаторов".

Так случилось, что волею судеб в ходе известного процесса "Андрияновгейт" кто-то обратил мое внимание на диссертацию, написанную в 2007 году (теперь уже одним из сотрудников ректората МГУ) "Особенности социально-политических процессов в Республике Ингушетия".. и я любопытства ради запустил ее в такой "анализатор". Через несколько секунд "анализатор" выплюнул мне другую диссертацию, написанную в том же МГУ, но годом позже: "Особенности социально-политических процессов в Республике Северная Осетия-Алания". Почему? Оказалось, что машина при сравнении текстов этих научных трудов пофразно обнаружила массу совпадений, которые высыпались на мня с экрана ноутбука, как из рога изобилия.

Немного доавтоматизировав свой "анализатор" мне удалось составить портрет более поздней диссертации (про РСО-Алания) с закрашиванием тех страниц, на которых совпадений оказалось слишком много. Получилось что-то в стиле обожаемого мной немецкого народного проекта VroniPlag:

Vrd


В принципе, все страницы на (на оригинальной схеме по ссылке сверху) должны быть кликбл, но до такой автоматизации пока дело не дошло. Для примера я сделал только одну страницу №111. Кликайте ее на здоровье.

Вот какие интересные открытия можно сделать на пороге следующей информационной революции ))

Comments

afrikanbo
Mar. 7th, 2013 12:02 pm (UTC)
ужас, ужас, ужас!
В понедельник мы узнаем, у кого он списал свои диссертации. Доживем до понедельника.

Edited at 2013-03-07 12:05 pm (UTC)
olkol
Mar. 7th, 2013 08:42 pm (UTC)
Еще в копилку:
http://historyofsuccess.ru/index.php?option=com_content&view=article&id=59:kobr&catid=36:2009-11-17-13-51-31&Itemid=40
Чем-то он неуловимо напоминает к.п.н. Бурматова...
А что ожидается в Пн, коли не секрет?
gorynych_007
Mar. 7th, 2013 09:30 pm (UTC)
Параллельные биографии
Мне одному кажется, что это - калька вот с этой творческой биографии?

http://www.vestnik.com/issues/97/0527/win/toom.htm

На секундочку, чтобы два раза не вставать: этот герой всю войну работал наседкой:

http://www.lebed.com/1997/art118.htm

Интересно, Кобринский согласился бы на такое?

Совок просто штамповал таких. В промышленных масштабах :(

lpauzner
Mar. 7th, 2013 09:52 pm (UTC)
По вашей ссылке вышел на "Кбр":
http://dissernet.org/index.php/DISSERNET.ORG:%D0%9A%D0%B1%D1%80/171-180
А как получилось что в левом столбце почти в каждом абзаце грубейшие опечатки, а в правом столбце ничего подобного не наблюдается? OCR разного качества? Тексты взяты из разных источников? Просто любопытно.
afrikanbo
Mar. 7th, 2013 10:55 pm (UTC)
"Очепятки" и слева и справа. Это то с каким качеством оцифровываются pdf тексты диссертаций.
glas_predkov
Mar. 8th, 2013 06:35 pm (UTC)
dissernet.org - блеск! Посмотрел на детальное сравнение текста Кобринского с оригиналом - хороша-а-а! Удовольствия было бы еше больше, если бы заимствования выделялись другим, например желтым, фоном, всюду, - наверняка, ты это уже запланировал!
afrikanbo
Mar. 8th, 2013 06:38 pm (UTC)
Паша привет!

конечно запланировал, )) но завтра срочно вылетаю в Камбоджу. Так что пока...
С другой стороны - там всё дозапятотно будет покрашено в один густой цвет. Я это уже прикидывал - смотрится отвратно )
glas_predkov
Mar. 8th, 2013 06:41 pm (UTC)
может, цвета нежного детского шоколада, так, не очень густого?

Profile

Golden Gate
afrikanbo
Андрей Ростовцев

Latest Month

July 2014
S M T W T F S
  12345
6789101112
13141516171819
20212223242526
2728293031  

Tags

Page Summary

Powered by LiveJournal.com
Designed by Michael Rose