Сергей Владимирович Лесников

(фрагмент «
Информационно-поисковый гипертекстовый тезаурус метаязыка лингвистики
- гипертекст – это форма, а информационно-поисковый - одно из предназначений)
 

Особенностью моделируемого тезауруса является то, что помимо ключевых слов тезарус может помочь пользователю выделить смысловые акценты, соответствующие поисковому запросу.
Суть конструируемого информационно-поискового тезауруса /ИПТ/ заключается в расширении возможностей поисковых систем для обеспечения релевантности и пертинентности запросов пользователей. Используя тезаурус, можно получать результаты поиска (соответствующие как информационной потребности пользователя, так и уместности результатов, а также робастность, состоятельность) с достаточной степенью эффективности поиска, выдавая пользователю не только информацию о ресурсах, узуально и/или окказионально содержащих введенные пользователем ключевые слова, но, главным образом, ресурсы, семантически связанные с ними термины, а также соответствующие дескрипторы, дефиниции, иллюстрации, интерпретации, леммы, объяснения, определения, понятия, пояснения, разъяснения, толкования, трактовки, формулировки, экскурсы и эксцерпции.

Программно сконструировав гиперссылки, на базе такого тезауруса можно также подсказать пользователю, по каким еще вокабулам целесообразно продолжить поиск (напр., антонимы, гиперонимы, гипонимы, квазисинонимы, лексико-семантические варианты, меронимы, холонимы).
1) Тезаурус мыслится как один из видов системного, тематического, идеографического словаря, а именно такой вид, который представляет собой некоторый макет лексической системы языка.
2) Тезаурус совмещает в себе черты известных тезаурусов (П. М. Роже, Ф. Дорнзайф, X. Касарес) и словарей лингвистических терминов /СЛТ/. Это значит, что, с одной стороны, каждое слово в нем дается в окружении всех семантически близких ему слов, а с другой стороны, каждое слово сопровождается его толкованием.
3) Моделирование осуществляется путем интеграции всех СЛТ, а затем последовательного маркирования множества терминов. Вычленение лексико-семантических классов условной эквивалентности и актуализация др. зон словарных статей тезауруса проводится в соответствии с тем, как в лингвистических источниках группируются термины. Характер разбиения может быть проиллюстрирован, например, такой цепочкой. … и т. д. Подобное дедуктивное разбиение должно постоянно сопровождаться встречной индуктивной коррекцией. При этом, если при выделении наиболее общих классов главным является дедуктивный метод, то при определении конечных классов, которые объединяют собственно слова, более важной представляется группировка слов в зависимости от их семантической близости. Из этого между прочим следует, что составитель синтетического словаря должен располагать возможно более полным списком так называемых закрытых тематических рядов (типа «названия средств перемещения», «названия предприятий торговли», «названия родственников»). Родовые имена, с которыми соотносятся подобные лексико-семантические группы, составляют нижнюю границу дедуктивного разбиения. Поскольку лексика языка не допускает строгого и однозначного разбиения, одно и то же слово (имеется в виду слово в одном значении) может входить в разные конечные лексико-семантические группы. Это приводит к необходимости выработки и использования системы перекрестных отсылок. Система отсылок отражает семантическую полифоничность слова, или свойство его значения состоять из разных дифференциальных элементов и входить поэтому в разные лексико-семантические группы. В конечном итоге она позволяет рассматривать препарированную и разложенную по полочкам лексику как нечто единое, целостное, спаянное.
4. Описание сочетаемости каждого слова строится с учетом идеографического членения лексики. Близкое (в пределах одной группы) расположение семантически родственных слов способствует достижению значительной унификации при описании и устраняет его избыточность.
 

 

 http://lsw.ru  http://ЛСВ.РФ  E-mail: serg@lsw.rugowor@online.rulsw@mail.ru.