«Пусто — Непусто», БИТ, «Коран»…
Страница 1

Рассказ о различных информационных языках потребовал бы не очерка, а целой книги. Мы ограничимся лишь несколькими ИПЯ, наиболее известными или интересными.

«Пусто — Непусто» — так назывался первый в нашей стране информационный язык, разработанный в ВИНИТИ в начале шестидесятых годов. Этот ИЯ предназначался для поиска рефератов по электротехнике с помощью ЭВМ. Знаменательные слова, или, говоря языком информатики, дескрипторы кодировались трехзначными числами. Например, фраза «данные о напряжении тока» на этом языке записывалась так: 153.414.883 (153 — данные, 414 — напряжение, 883 — ток). Информационный язык «Пусто — Непусто» применен был для текстов на двух языках — русском и английском.

В 1965 году В. И. Тарасовым был предложен информационный язык «Кристалл». В отличие от «Пусто — Непусто» кодирование в нем смешанное, с помощью слов и цифр. Слова текста записываются в исходной форме, без грамматических форм. С помощью чисел обозначаются отношения между словами. В наши дни язык «Кристалл» применяется в самых различных сферах: с его помощью отыскивается информация в области химии, медицины, приборостроения, легкой промышленности и т. д. Свыше ста тысяч различных документов переведено на этот информационно-поисковый язык.

Для того чтобы облегчить поиск публикаций по органической химии с помощью машин, разработан информационный язык, получивший название «ИЯ стандартных фраз». Специфика этого языка в том, что он имеет дело не с простыми текстами, представляющими линейную последовательность букв, а с химическими формулами. Формулы же органической химии, как известно, структурны, они располагаются в двумерном пространстве. Поэтому пришлось разрабатывать особый код, с помощью которого двумерные формулы превращались в линейную последовательность цифр.

Наиболее сложный и четкий по своей логике ИЯ был разработан в нашей стране группой сотрудников Института кибернетики АН УССР под руководством Э. Ф. Скороходько. Язык этот получил наименование БИТ. Термины на нем могут быть представлены в трех вариантах: в виде формул, графиков и таблиц. Первый вариант записи наиболее экономичен, второй — нагляден, третий—пригоден для машинной обработки текста (киевские кибернетики разработали специальные программы, которые позволяют ЭВМ переводить текст с естественного языка на искусственный язык БИТ).

В основе этого информационного языка лежит мысль о том, что структура внешнего мира состоит из единиц двух видов: предметов и их отношений. Эти первичные единицы порождают производные — ситуации. Предметы обозначаются символом X, который может иметь различные индексы вверху и внизу. Так, термин «изображение» получит символ Х0 024, где верхний нолик означает, что мы имеем дело с элементарным понятием, а нижнее число показывает номер данного термина в списке. Более узкий термин, например «полупроводниковый триод», закодируется в виде символа Х2301.

Отношения между предметами — релатемы — кодируются латинской буквой R, которой также приписаны верхние и нижние индексы. Ситуации на языке БИТ записываются в виде предложений, состоящих из соединения символов X и R, имеющих различные индексы. Словарь терминов в этом языке разработан для текстов по радиоэлектронике, но, судя по всему, БИТ может пополняться новыми терминами и понятиями.

Естественно, что появление нового предмета требует нового индекса. Для отношений это не обязательно: производные релатемы могут образовываться сочетанием основных (например, сочетание релатемы «быть местом» и «иметь субъект» образует релатему «быть местом действия»).

Информационный язык БИТ — это усовершенствованный вариант так называемого Кливлендского семантического кода. Код разрабатывался группой американских ученых в городе Кливленд для механизированного поиска информации по металлургии. Алфавитом кода служат не только латинские буквы, но и специальные знаки и числа от 000 до 999. Каждое знаменательное слово, то есть дескриптор, записывается в виде сочетания трех согласных букв. После второй согласной оставляется пробел, который заполняется какой-либо гласной. Вставная буква указывает на определенное отношение, например: А — это «принадлежность, быть предметом»; О — «производить» и т. п. Из простых дескрипторов строятся составные, более сложные. Так, для записи слова телефон используются дескрипторы прибор, передача, электричество, информация (ведь телефон — это и есть прибор, предназначенный для передачи информации при помощи электричества).

Таким образом, мы имеем дело с набором элементарных понятий, или, как назвали их создатели Кливлендского семантического кода, смысловыми множителями — по аналогии с физическими базисными величинами (хотя, конечно, никакого умножения тут не происходит, лишь из кирпичиков простых дескрипторов строятся более сложные).

Страницы: 1 2

Другие статьи:

ЧЕРНЫЙ ЯЩИК
«Черным ящиком» называют в кибернетике систему, устройство которой неизвестно. Мы получаем информацию лишь на входе и на выходе и на ее основании стремимся понять поведение системы. Именно таким « ...

Костыль или вспомогательное средство?
Анатоль Франс называл словари «вселенной, расположенной по алфавиту». И я, даже по прошествии стольких лет, беря в руки словарь, всегда испытываю волнение. Мы, переводчики, счастливый народ. Одно д ...