Anatoly Levenchuk (ailev) wrote in openmeta,
Anatoly Levenchuk
ailev
openmeta

Переписка M&A 19 июля -- публикации, разговор с богом через Гугль, контексты, нелпероиды



Для начала обсуждается управление сайтом www.openmeta.org (это стандартный коммунивер-сайт) для публикаций на нем уже имеющихся моделей

metanymous
Там, поди, можно будет потом персональную информацию добавить? Я имел в виду список публикаций уточнить. Не помню года, а сборники растерял. Ладно, счас кликну простую регистрацию. Все ушла на метанимуса.

ailev
Да, конечно, персональная страничка редактируется юзером в любое время (когда залогинившийся юзер смотрит свою страничку, на ней высвечивается ссылка на редактирование содержания).

А стОящие публикации лучше не списком помещать, а прямо текстами (по случаю можно и отсканировать – вот и повод, вроде есть ;)

metanymous
Пытаюсь отыскать данные моих старых и немногочисленных публикаций. Конечно, с удовольствием разместим. Их еще надо найти.

ailev
Ну, не к спеху – жизнь длинная ;) Я свои публикации вообще перестал как-то собирать. Нехорошо, конечно, это. Я их оставляю ссылками на какие-то чужие сайты, а потом эти ссылки не работают. Но мои публикации не слишком научные...

-----------------------

В какой-то мере я использую Гугль, как готовую "патентную базу" использовали в начальных исследованиях по ТРИЗ/АРИЗ. Энциклопедия языковых паттернов, источник вечного наслаждения для исследователей.

metanymous
Конечно, конечно, конечно. Когда мы придумывали название (для вторичных языков) в (93-95) у нас не было гугля в хороших знакомых. Сейчас мы знаем, что через гугль могжно даже запрос богу послать.

ailev
Запрос-то послать можно. Вот ответ получить... ;)

metanymous
Вот набираем: "бог скажи ответ словами прямо мне"
Ответ: ... 1 2, Новая ТЕМА, Послать ОТВЕТ. ... талантом тащиться; Скажи – откуда ты ... бы не дай бог там одному ... (на первой странице)

ailev
Я же предупреждал – спрашивать по-русски нужно не у Гугля, а у Яндекса. Повторите – и почувствуйте разницу ;)

metanymous
Или полуавтоматически составлять толково-комбинаторный словарь. Через специальную форму запросов.

ailev
Ну, тут сложнее: составлять ли при данной технологии такой словарь, или получать необходимое гнездо словаря динамически по запросу – это при нынешнем уровне развития технологий еще нужно выбрать. А форма запроса-то какая?

metanymous
Я экспериментировал с возможностью выкачивания лексических функ, актантов/валентностей. Я дошел до мысли, что существует "вопросная форма" существования языка. И проверяю ее (очередное семя?)

---------------------------------
ailev
У меня строгое предположение, что у мозга процессинг идет по алгоритму контент-анализа. В течение жизни просто накапливается многомерная матрица смысловых расстояний между словами (вот некий Крейнис, на работу которого я уже ссылался – "Ключи от текста" – хвастается, что открыл очень похожую на используемую субстратом метрику расстояния). Эта матрица и сейчас накапливается ;)

А контекст – это некоторый малоразмерный срез этой матрицы (подматрица). Переключение контекста – это смена подматрицы. Поэты – это про особые способы перещелкивания контекстов, это вполне тренируется. Сами контексты не слишком связаны друг с другом – но зато по буквально паре-тройке слов автоматически загружаются в Оперативную Память. Поэты – это когда загрузка в оперативную память происходит с одного слова (просто настройка такая). Метапрограммисты предъявляют специально сконструированный речевой поток, который явным образом взаимодействует с алгоритмом "вытаскивателя" контекстов с одной стороны, и эффективно меняет настройки по вытаскиванию собственно контекстов.

С другой стороны, этот механизм контекстов (механизм ассоциативной памяти) работает не только со словами, он вообще универсальный для модальностей.

Как ни странно, я считаю, что главные прорывы в контент-анализе (а контент-анализ с ходу показывает более интересные результаты, нежели любые другие способы "понимания естественного языка") будут происходить на линии борьбы со спамом. Дело в том, что спам для одного человека – жизненно необходимая информация для другого человека. Поэтому нужно заниматься не просто анализом текста на предмет определения спама, а анализом текста с использованием знания о контексте пользователя. Сейчас в спаме используется самое начало контентного анализа – байесовская статистика. Но я думаю, что там быстро догонят и перегонят лидеров контент-аналитиков. Ибо борьба со спамом является потребительской потребностью. Так что ждем открытий и откровений.

Переключалка контекстов никак не связана со временем, вся эта Ассоциативная Оперативная Память работает в парралель независимо от времени, все смыслы вытаскиваются в параллель (куда вытаскиваются, зачем вытаскиваются, как вытаскиваются – это еще нужно поразбираться). Я пока очень невнятно на это намекал – невнятно в силу своего собственного недопонимания ;)

Еще один интересный аспект проблемы – это микроконтекст ("понимание здеся и сейчаса"), который я отличаю от только что прокомментированнгого просто контекста (понимание обсуждаемой предметной области). Конечно, микроконтекст и контекст пересекаются – но микроконтекст ответственен за разрешение всяких ссылочных слов типа "он", "там","тогда", пропущенных референций ("послушай, ..." – кто должен послушать?) и т.п.

С микроконтекстом работает совсем другой механизм, он существенно связан со временем – это развертка, это язык. Лучше всего с микроконтекстом разбирались в проекте великого и гениального Дугласа Лената CYC (www.cyc.com),там на сайте лежит лучшая статья о микроконтекстах (они мой микроконтекст называют все равно контекстом – включая туда и мой только что описанный "вневременной и внепространственный", а "предметный" контекст). Там вводится многомерное пространство контекстов, и итоговый контекст представляет собой точку в этом пространстве с координатами, определяемыми содержанием предыдущей коммуникации. То есть время тут не просто существенно, а очень существенно – есть несколько шкал контекста времени (типа "время, о котором говорим", "время, когда говорим" и т.д.), несколько шкал контекста пространства и т.д.

Вот это все соседнепредметное содержание (контент-анализ и работа с контекстами) нужно бы подтягивать и юзать на полную катушку.Но сил на это все, конечно, не хватит.

И как бы это все вышенаписанное выложить на общее обозрение? Много у нас тут в частной переписке напробегало, а потом опять будем жаловаться,что не записали, не успели, не опубликовали...

---------------

Кстати, новая тенденция в русском техническом сленге – oid используется как сокращение от "гуманоид" для обозначения нердов-пользователей какой-нибудь хайтех программы (линуксоид чаще всего, но есть и другие). Но это (пока?) только в русском языке. Поэтому по-русски "юзеры НЛП" были бы не нелперами/нэлпистами/нелперцами, а нэлпероидами ;)

metanymous
Нелпероиды – задохнулся от смеха – спасибо!

ailev
А ежели учесть, что основная операционная система, юзаемая нэлперцами – это мозговая, то с точки зрения линуксоидов все они мозгоиды, однозначно!

Но: "мы пойдем другим путем"!

С пламенным революционным приветом,
Ленинчук
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 7 comments