СИСТЕМА ПОИСКА В НОВОМ РУССКО-БОЛГАРСКОМ ИНТЕРАКТИВНОМ СЛОВАРЕ СЭД
Алфавитный поиск
Интерактивный русско-болгарский словарь СЭД находится в первой фазе разработки. Полное описание правил навигации возможно только при достижении словарем некоторого критического объема страниц. Однако по действующему онлайн фрагменту словаря, как представляется, можно судить в целом о принципах его организации, о заложенных в нем новаторских идеях, среди которых первостепенное значение имеет поиск по словарю. Читателю, привыкшему к традиционной линейной организации словарной статьи двуязычного словаря, будет полезна информация о новой структуре словарных страниц (статей) и абсолютно необходима информация о том, что и как можно найти в словаре.
Составление страниц нового русско-болгарского словаря и индексация элементов страниц для поиска – комплексный процесс, учитывающий разные стратегии читателя и возможности классификации лексических параметров для однозначного вывода в системе поиска. Одно из неизбежных противоречий словаря с развитой справочной системой состоит в том, что такой подход действительно упрощает поиск, но усложняет словарь в целом, как с точки зрения составления, так и в плане его восприятия читателем. Отсюда вытекает необходимость справочной рубрики для поиска по словарю.
С другой стороны, “алфавитный образ” классического словаря порой по инерции создает иллюзию “надежности и предсказуемости” алфавитного поиска даже там, где алфавит не может быть использован по ряду причин. В словаре СЭД, разумеется, представлен алфавитный индекс слов, но поиск по русскому или болгарскому алфавиту не разнонаправлен: в преобладающем большинстве случаев результат поиска слова прицельно однозначен - одна комбинированная словарная статья для двух встречных запросов:
Фиг. 1. Сводимость запросов по словам.

Вот почему поиск по алфавиту в словаре СЭД, в отличие от переводного словаря, на практике является одновременно двусторонним и двуязычным, несмотря на то, что искомое слово может быть либо русским, либо болгарским. Очень важно с самого начала работы со словарем привыкнуть к параллельному, паритетному представлению двух языков. На “чаше весов” могут оказаться русские и болгарские многозначные слова: ср. жарить (мясо) и пържа, пека, задушавам. Не будет считаться ошибкой, если мы озаглавим комбинированную страницу “ЖАРИТЬ - ПЪРЖА”, при условии, что на этой же странице представлены эквиваленты пека (печь), задушавам (тушить, душить), определено их эквивалентное соотношение с русским жарить, но также со словами печь, тушить, душить и т.д. Ключевым для понимания приоритетов попарной расстановки слов является первичное значение слова: читатель может вскрыть его толкование щелчком мыши. Толкования как правило изолированы и синхронизированы, помечены одинаковым цветом для данной эквивалентной пары (например, синим). В заглавной паре при щелчке мышью открывается полный список значений. При этом нет смысла выделять специально первичное значение, если оно является первым в списке (исключением являются предпочтения некоторых словарей к историческому принципу классификации значений слова).
Фиг. 2. Узловая пара и первичные значения слов.

Толкование слова является лексикографической интерпретацией, которая может варьировать от словаря к словарю. Читатель может оценить эти различия как несовершенство словарей или разнобой в методах словарного описания значений слова. В некоторых случаях он будет прав, однако полезно помнить, что значение слова ненаучно изначально, оно меняется во времени либо приобретается в контексте, а его нюансы зависят даже от, казалось бы, таких внешних факторов, как возраст и пол говорящего. Словарные толкования не могут быть прямым объектом сопоставления в словаре СЭД, но являются необходимым контекстом и привязкой к значению слов, объединенных в эквивалентную пару.
Таким образом, алфавитный поиск в словаре СЭД является точкой заказа объединенной страницы словаря. При этом сам алфавит не является принципом организации словарных статей.
Представим себе подъезд многоэтажного дома, в котором квартиры не пронумерованы, а названы по фамилиям жильцов. На первом этаже Аничковы, Анисимовы и Андроповы, на двадцать пятом - Якубовские, Янсоны, Яковлевы и т.д. В незнакомом доме как правило ищут знакомых. Таким же образом в словаре страницы (квартиры) названы пофамильно: "лгать - лъжа", "портить - изпортвам" и т.д. Однако "жильцы" словаря - народ экспансивный, непоседливый и привередливый. Многозначные слова требуют большего уважения к себе и претендуют на долю соседей. Лгать старшие живут на этаже "Л", но Лгать младший решил отделиться и прописался в квартиру "клеветать - клеветя", торжественно пообещав хозяевам отныне не лгать, а клеветать (лгать на всех). Жилец Брать проявил завидный альтруизм и взял к себе бедных родственниковПолучать, Взимать, Овладевать, Отнимать, Захватывать. Жилец Oтдать не выдержал и отдал распоряжение администратору словаря: в трехдневный срок (согласно предложению и при личном участии жильца Наводить) оформить порядок...
Эта гипотетическая ситуация превращается в реальность для лексикографа, а в двуязычном словаре, как нетрудно понять, проблемы возрастают прогрессивно по многим причинам. Поэтому в словаре СЭД алфавитная организация уступает место организации слов в смысловые поля, эквиваленты представлены как последовательные цепи пар, сам же алфавитный поиск является только первым шагом.
Комбинированный поиск
Слово искать толкуется так: ‘стараться найти, обнаружить что-л. спрятанное, потерянное, скрытое‘ (МАС). Добавим: найти и иметь в своем распоряжении. Для системы поиска в словаре не существует понятий “спрятанное”, “потерянное”.
Клик-поиск
Для прямого выхода на словарную статью в СЭД достаточно кликнуть по слову в алфавитном списке. Условно говоря, в интерактивном словаре каждый клик является запросом. Алфавитный клик-запрос выводит адрес страницы в рабочее поле словаря. Но сам по себе он не информативен: это аналог рутинного приказа “Откройте словарь на странице такой-то”.
Фиг 3. Алфавитный клик-запрос.

Именно с этого момента начинается комбинированный клик-поиск. Поскольку заглавная пара является узловой, в словарной статье ей посвящена вся первая строка словарной статьи. В этой строке находятся микромодули с информацией о синонимах слова (СИН), фразеологизмах (ФР), включающих узловое слово или имеющих аналогичное значение. Выборки из национальных корпусов с примерами живого употребления слова и комментариями представлены в модулях НКРЯ (национальный корпус русского языка) и БНК (български национален корпус). Это соответствует поиску “Ищу примеры употребления слова в разных контекстах”. Дана также ссылка на ассоциативный словарь (АСС), морфологический анализ слова (МОРФ), источники по теме (ПЗ - полезно знать). Сверхзадачей словаря СЭД является когнитивный анализ макрогруппы имен экспансивных действий в двух языках. Когнитивные комментарии к заголовочной паре представлены в модулях ТЭД (тип экспансивного действия, к которому отсылает слово) и ИР (индекс результата действия, обозначаемого заглавным словом). Информация, представленная в модулях, выводится во всплывающих окнах на странице. Таким образом, приблизительно треть информации в словарной статье посвящена заглавной паре.
Понятие узла словарной статьи чрезвычайно важно. Узел может быть представлен парой слов, между которыми прослеживаются четкие отношения эквивалентности в первичных значениях и наблюдается регулярная статистика прямого и обратного перевода в разных контекстах. Узел может быть также представлен уникальным словом, для которого невозможно установить одно-однозначное отношение переводимости. Таковы, как правило, слова, обозначающие реалии, либо содержащие коннотации, оценку и имеющие стилистическую специфику (р. артачиться, б. урочасвам). Узел может быть оформлен парой слов, из которых по той или иной причине лишь одно вошло в орбиту имен экспансивных действий. Таков случай р. ахнуть и болг. ахна. В общей классификации они нашли бы отражение как гомогенная пара ахнуть - ахна. Русское ахнуть означает также: перех. Прост. С силой ударить. [Мирон Григорьевич], почти не размахиваясь, ахнул его по скуле. Шолохов, Тихий Дон [МАС]. Узел словарной статьи является также ее заголовком. Система индексации словарных статей в СЭД базируется на заголовке, который совпадает с узловым словом или парой.
Значения слов доступны при щелчке мышью. Соотносимые значения членов эквивалентной пары маркированы цветом либо даются изолированно для каждого слова. Это соответствует поиску “По какому значению слова объединяются в эквивалентную (переводную) пару?”
Справочная база дает необходимые сведения о сокращениях и толкует основные элементы страницы словаря. Она представлена на каждой странице и является незаменимой для читателя, если он по какой-либо причине не успел ознакомиться подробно с рубриками словаря. По сути информация в справочной базе является введением в словарную страницу и представляет собой часть миниатюрной “языковой лаборатории”.
Фиг 4. Справочная база страницы словаря СЭД (всплывающее окно).

Целевой поиск
Целевой поиск производится по критериям читателя. Практически невозможно предусмотреть всю совокупность критериев отбора слов для поиска по словарю в целом. Любой текст словаря может быть найден при использовании обычной техники ввода слова или сочетания слов в окно поиска на вкладке “Поиск”. При этом в поисковом окне словаря можно использовать стандартные процедуры поиска Google. Возможны простой поиск, логическое ИЛИ, логическое НЕ, Похожие слова, Маски, Определения и др. Для поиска сочетания слов или более длинного текста необходимо использовать кавычки.
Фиг. 5. Поиск слова побеждать в текстах словаря СЭД.

Поиск по отдельным словам дает полную информацию о том, где они встречаются в текстах словаря. Скорее всего, эта информация будет избыточной для данного поиска и потребует сортировки, а это не то, что нужно. Тем не менее, поиск можно семантизировать и направить в определенное русло, а это позволяет не только найти необходимую страницу, но также проводить лингвистический анализ. Кроме перечисленных выше стандартных методов ограничения поиска, читателю предложены следующие возможности:
Поиск толкований. Например, для слова побеждать необходимо ввести в окне поиска
побеждать толк
либо
толк побеждать
Поиск синонимов. Например, для слова брать необходимо ввести в окне поиска
син брать
или
брать син
Для поиска фразеологизмов: фр лгать либо лгать фр.
Ассоциации слова можно найти, используя добавку асс к искомому слову, для поиска примеров из национальных корпусов достаточно добавить к русскому слову нкря (сокр. Национальный корпус русского языка), а к болгарскому – бнк (сокр. Български национален корпус). Можно аналогичным образом добавлять сокращения тэд и ир для получения справки о когнитивной специфике слова. Наконец, можно воспользоваться вставкой пз (полезно знать). При этом станут доступны ссылки на источники, энциклопедические сведения, публицистические материалы по теме: значение слова, история, этимология, употребление; стратегии, социальные действия, статистика и др.
В рубрике “Навигация и поиск” СЭД даны подробные сведения о возможных вариантах поиска с учетом нелинейной специфики параллельного двуязычного словаря. В качестве общих практических советов мы хотели бы дать следующие:
- Антонимы не отражены в словаре, они не вписываются в схему экспансивного действия.
- Синонимы даются только для заголовочной пары (для каждого члена пары).
- На первоначальном этапе в словарь включены преимущественно глаголы.
- Морфологический анализ слов требует подключения словаря к сети Интернет.
- Для выхода на страницу нужно искать слово по алфавитному списку либо набрать слово в окне поиска.
- Если не удается выйти на страницу, она либо не готова, либо слово не имеет нужного приоритета. Например, омоним браня к русскому бранить не фигурирует в алфавитном списке.
- Пользоваться комбинированным поиском: в этом случае поиск браня выведет на страницу БРАНИТЬ.
- Пользоваться комбинированным поиском (вкладка “Поиск”) для получения полной информации о слове в словаре.
- Использовать контекстуальную помощь на странице под чертой.
Словарь СЭД является интернет-ориентированной разработкой в жанре электронной сопоставительной лексикографии. Он не является первоисточником для толкований слов и не классифицирует синонимы. Словарные статьи СЭД включают ссылки на другие квалифицированные источники, среди которых - авторитетные печатные словари. Задача составителя СЭД - использовать в максимальной степени накопленный лексикографический опыт, а не переписывать заново словари. Преемственность в лексикографии - давняя традиция и залог успеха любого лексикографического проекта. Это тем более важно для интегрального двуязычного словаря, в котором слова двух языков сопоставляются, толкуются и представляются как переводные эквиваленты одновременно, благодаря синхронизации толкований значений.
ПРИЛОЖЕНИЕ
Словарь СЭД - словарь имен экспансивных действий в русском и болгарском языках.
Экспансивные действия, или экспансия - целенаправленные действия Х-а (совокупности Х-ов) либо состояния Х-а, которые то ли по характеру, то ли по замыслу, то ли по результатам способны вызвать изменения в сфере Y-а (совокупности Y-ов), изменить привычный для него статус, норму, создать ситуацию дисбаланса интересов, сил, возможностей, но никогда - в пользу только Y-а. В общем случае экспансия проявляется как влияние, вмешательство в некоторое положение дел на стороне Y-а, поэтому она крепко спаяна с аксиологией говорящего.
Интерфейс словаря СЭД - принятый авторами способ подачи лексикографического материала и графического оформления словаря, а также совокупность средств для взаимодействия пользователя с активными элементами страниц, в том числе - для обратной связи с авторами. Читатель может использовать страницы словаря в режиме пассивного (потребитель) и активного (соавтор) пользователя.
СОКРАЩЕНИЯ
МАС – Малый академический словарь русского языка. В 4-х т.
ТЭД - тип экспансивного действия, к которому отсылают слова, базируется на типологическом анализе имен экспансивных действий, для чего было произведено распределение лексики по семантическим классам, в зависимости от способности слов отсылать к определенным типам действий, а также от способов обозначения различных фрагментов схемы экспансивного действия. Выделены и обстоятельно классифицированы следующие типы экспансивных действий: ликвидирующие действия, деформирующие действия, аннексирующие действия, дезориентирующие действия, принижающие действия, блокирующие действия, действия вмешательства, провоцирующие действия, регулирующие действия, экспансивное поведение.
НКРЯ и БНК. Национальный корпус языка - это собрание текстов в электронной форме, адаптированное для исследований и поиска. Ссылка на Национальный корпус русского языка (НКРЯ) и параллельная ссылка на Български национален корпус (БНК) дается только для пары слов в заголовке страницы. Примеры из корпусов подобраны с целью показать живое употребление и сочетаемость слов.
Полезно знать (ПЗ) - ссылки на источники, энциклопедические сведения, публицистические материалы по теме: значение слова, история, этимология, употребление; стратегии, социальные действия, статистика и др.
МОРФ – морфологический анализ слова. Ссылка дается только для заглавной пары.
АСС - ссылка на ассоциативный словарь.
ФР - ссылки на фразеологические словари русского и болгарского языков. Фразеологизмы даются только для заголовочной пары, т. е. для верхнего уровня страницы. Пары типа лгать и врать могут иметь общую фразеологическую базу.
СИН - ссылки на словари синонимов русского и болгарского языков. Синонимы даются только для заголовочной пары, т.е. для верхнего уровня страницы.
См. также рубрики: Карта сайта | Дизайн СЭД | Интерфейс СЭД | Правила | Статьи и материалы | ИСК | Март 2011 | Будущим Соавторам | Избранные публикации | Выход

