Инструкция по пользованию этимологической базой данных

Экран выбора базы данных

Первый экран интерфейса к этимологической базе данных предлагает выбор из имеющихся баз, а также настройку параметров интерфейса.

Главное поле выбора позволяет указать, к какой базе данных Вы хотите сделать запрос.

Если Вы имеете право редактировать базы online, Вы можете воспользоваться кнопкой "Логин". Для входа в режим редактирования баз данных Вам необходимо иметь зарегистрированный логин и пароль. При их отсутствии все базы данных доступны только для чтения.

Настройка параметров интерфейса производится следующим образом:

"Перекодировка" управляет режимом вывода специальных символов. Словарные данные хранятся в базе в фонетической транскрипции, и для ее отображения используется специальная кодировка и специальные шрифты (шрифты для Windows Вы можете скачать здесь; шрифты для Macintosh в кодировке Western MacRoman - здесь). Если этих шрифтов у Вас нет, программа может отображать транскрипцию в специальном коде. В этом случае Вам нужно поставить галочку в поле "Перекодировка".

"Графика как картинки" позволяет указать режим отображения двухбайтовых символов (китайских, греческих, арабских и пр.) . По умолчанию они отображаются в виде картинок в формате GIF. Однако если на Вашем компьютере установлены соответствующие шрифты, Вы можете отменить вывод в виде картинок. Для китайских иероглифов следует использовать шрифты в кодировке BIG5; для греческого и арабского следует использовать шрифты, содержащиеся в TIMESTR.ZIP.

Поле "Таблицы" определяет режим вывода таблиц. По умолчанию данные выводятся в табличном формате, но можно отменить его - если вы, к примеру, используете текстовые браузеры типа Линкс.

Поле "Номера записей" позволяет скрыть или вывести на экран номера записей в базе данных.

Поле "Многооконный режим" позволяет выводить отсылки в новое окно браузера или в главное окно - по Вашему усмотрению.

Установив перечисленные параметры, нажмите кнопку "Послать запрос".

В нижней части экрана имеется небольшое кнопочное меню, позволяющее выбрать одну из нескольких существующих кодировок для русского языка (Koi, Alt, Win), а также дающее возможность перейти на английский язык интерфейса.
Недавнее добавление (март 2001 г.) - возможность использовать уникодную кодировку. Помимо трех указанных выше кодировок, можно использовать уникод (UTF) в вариантах UTF-RUS и UTF-ENG - но только если Ваш браузер поддерживает уникод и на Вашем компьютере установлен уникодный шрифт.
Примечание: пока только два браузера - Netscape 4 (и выше) и Internet Explorer 4 (и выше) поддерживают уникод. Уникодные шрифты также ведут себя по-разному. Times New Roman Star (в последней версии) - уникодный шрифт, и с ним большинство символов будет выводиться правильно, но вместо некоторых международных символов будет выводиться кириллица. Китайские шрифты типа UWCXMF или Mingliu содержат уникодный набор китайских иероглифов, но не имеют большинства международных фонетических символов. Напротив, Code2000, Lucida Sans Unicode и Titus Cyberbit не имеют китайских иероглифов. Самый полный шрифт из пока существующих - Arial Unicode MS.

Чтобы установить выбранную кодировку, нажмите кнопку "Изменить".


Экран запроса к базе данных

Основная часть данного экрана представляет из себя таблицу, заполнив которую, Вы определяете, какие записи из базы Вы хотите увидеть и какие поля в каждой записи будут отображаться. Каждая строка таблицы соответствует полю базы данных.

Отметив флажок "Включить в вывод" против имени поля, Вы указываете, что это поле должно включаться в ответ на запрос. Если ни одного поля не указано, в ответ будут включены все поля базы. В графе "Текст запроса" Вы можете указать свои требования к значению поля. Требования указываются в виде строки, а способ, которым эта строка интерпретируется механизмом запроса, выбирается в списке "Метод запроса". Поддерживаются следующие методы:

Начало
Строка, указанная в графе "Текст запроса", должна находиться в начале значения поля.
Подстрока
Строка, указанная в графе "Текст запроса", должна присутствовать в значении поля, не обязательно в начале.
Фонетическое сходство
Начало поля фонетически сходно со строкой, заданной в графе "Текст запроса"
Фонетическое сходство - подстрока
Строка, указанная в графе "Текст запроса", сходна фонетически с какой-либо подстрокой, содержащейся в поле.
Семантическое сходство - значение
Строка, указанная в графе "Текст запроса", сходна по         значению с содержимым данного поля. Здесь следует учитывать, что (пока) обрабатываются только запросы на английском языке, и семантическое сходство понимается весьма широко - как наличие некоторого общего семантического компонента.
        Вы можете также вести поиск во всех полях одновременно, используя нижнюю строку "Поиск в любом поле".

Наконец, с помощью списка "Сортировка по полю" Вы можете выбрать порядок записей в ответе на запрос.

Способы ввода запросов.

Запросы, содержащие специальные символы, могут вводиться в условной кодировке . Для этого необходимо окружить текст запроса (или отдельные символы внутри него) фигурными скобками. Например, чтобы искать последовательность ™a®, следует ввести: {k.at.} или {k.}a{t.}.


        Греческие буквы можно также вводить в фигурных скобках, но после первой из них должна стоять буква G: {Gkata} и т.п.

        Кириллические буквы можно вводить латиницей, окружая их квадратными скобками: [golova].
        В запросах допускаются wildcard characters: знак ? заменяет любой одинарный символ; знак @ - любую последовательность символов.


        Вы можете вводить запросы и без перекодировки, но на свой страх и риск: результат будет зависеть от текущей кодовой страницы, установленной в Вашем браузере, от национальных характеристик операционной системы и т.п.

        Если Вы используете кодировку UTF (уникод), wildcard characters и фигурные скобки будут правильно обрабатываться только если весь запрос начинается с фигурной скобки.
 

Пояснения к использованию иероглифов

Чтобы искать иероглифы, необходимо соблюсти следующие условия:

A. Без уникода:

1) На вашем компьютере должна быть установлена программа TwinBridge (или сходная). В базах данных используется кодировка Big5, так что именно она (а не, к примеру, GB) должна быть установлена в вашей программе.

2) В опциях Вашего браузера следует установить соответствующий китайский фонт.

При соблюдении этих условий можно выбрать в нижнем экранном меню опцию "Графика: непосредственно" и вводить иероглифы, пользуясь вашей клавиатурной раскладкой.

B. С уникодом:

        Если Ваша операционная система и браузер поддерживают уникод, и у Вас установлена поддержка ввода иероглифики, Вы можете непосредственно вводить в запрос иероглифы и другие уникодные символы.

Примечание: поиск по шаблонам (wildcards) с иероглификой не работает.

Предлагаемые Вашему вниманию базы данных - плод многолетнего труда сотрудников кафедры КиДЯ ФTиПЛ. Китайская, синотибетская, севернокавказская и енисейская базы были составлены членом-корреспондентом РАН С. А. Старостиным; алтайская - C. А. Старостиным, д. ф. н. О. А. Мудраком и д. ф. н. А. В. Дыбо; дравидийская - к.ф.н. Г. С. Старостиным; чукотско-камчатская - д. ф. н. О. А. Мудраком.

Компьютерная поддержка (СУБД и интерфейс) разработаны совместно С. А. Старостиным и Ю. Бронниковым на основе системы STARLING С. А. Старостина с использованием языков Clipper, C / C++ и TCL.