От лингвистики к социальным процессам

На основании формулы для вычисления относительной информации было проведено исследовние по самоорганизации случайных текстов разной тематики, которое на практическом материале подтвердило возможность решения задачи.

Общность текстов предопределена общностью входящих в них слов. Алгоритм вычисляет степень этой общности, которая отнюдь не случайна. Более того, случайные воздействия не могут препятствовать процессу консолидации. Это подтверждает непричастность алгоритма к наблюдаемым результатам и процессу. Его истоки - за пределами алгоритма, который только проявляет эту глубинную сущность, выводит ее на поверхность. Это свойсто дает предположить его другие применения - показывать не очень очевидные связи между явлениями по их известным характеристикам или по результатам действий.

Для исследования были составлены словари текстов, вычисления выполнялись по формуле:
H = i = n
SUM(Pi*Wi)/(1+15Gi)
    i
где:
Pi - частота употребления i-го слова одного из текстов
Wi - частота употребления i-го слова в другом тексте (или в группе текстов)
n - число совпадающих слов.
Gi - усредненная частота употребления i-го слова в языке, определяемая как отношение количества текстов, в которых это слово употребляется хотя бы 1 раз, к общему количеству текстов.

Образование каталогов выполнялось по условию: если значение Н, полученное для двух случайных одиночных текстов (или сборок текстов, каталогов) превышает некоторую заданную величину R, то они объединяются.

Интерпретация параметров для социальной модели

* текст = человек
* каталог = группа, сообщество (партия, обществ. организация, клуб и т.д.)
* слово = интерес человека,
* количество слов = степень интереса, оцениваемая по (например) 10-бальной шкале.
* R = граница вхождения в сообщество/выхода из него
* Gi - показатель массовости интереса. Определяется как отноношение количество человек, которые указали ненулевой i-й интерес, к общему числу людей.

В результате вычислений определяются группы "по интересам" - их количество и направленность. В пределах группы люди ранжируются по степени соответствия группе. В зависимости от значения границы объелинения (входа/выхода) получется разное число групп. При больших значениях (менее 0.004) их образуется много, малых по численности. С ростом этого параметра объемы группы растут, а их число сокращается. При значении 0.00075 происходит полная консолидация - нет индивидуальных субъектов/объектов, и нет каких-либо иных интересов, отличающихся от интереса этой единственной группы, включающей в себя всех граждан (= тоталитаризм).

(Предполагаемый) успех данного исследования позволил бы сделать вывод об объективных "математических" основаниях формы общественной организации. Вычисления могли бы показать направление приложения усилий для изменений характеристик общества - для того, чтобы стимулировать его развитие в желаемом направлении.

29.11.2008
Ханов О.А.
В начало