Адрес документа: http://law.rufox.ru/view/9/1215.htm

ГОСТ 7.52-85

     
Группа Т62

     
     
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР

     
     
Система стандартов по информации, библиотечному
и издательскому делу

     
КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ ОБМЕНА
БИБЛИОГРАФИЧЕСКИМИ ДАННЫМИ НА МАГНИТНОЙ ЛЕНТЕ

     
Поисковый образ документа

     
System of standards on information, librarianship and publishing.
Communication format for bibliographic data exchange on magnetic tape.
Search pattern of a document

     
     
     ОКСТУ 0007

Дата введения 1986-07-01

     
     
     РАЗРАБОТАН
     
     Государственным комитетом СССР по науке и технике
     
     Академией наук СССР
     
     Государственным комитетом СССР по стандартам
     
     Министерством электротехнической промышленности
     
     Министерством авиационной промышленности
     
     Государственным комитетом СССР по делам изобретений и открытий
     
     ИСПОЛНИТЕЛИ
     
     Г.Г.Белоногов, Н.Д.Кравченко, Н.П.Очнева, С.Я.Калачкина, В.И.Федосимов, В.Н.Белоозеров, О.А.Фуралев, Л.В.Шемберко, С.А.Горбань, Д.Г.Лахути, Н.В.Поцелуева, Е.Н.Казаков, А.Б.Антопольский, В.А.Киптенко, Т.В.Стрельцова, Н.И.Антонова, Ю.В.Сипапин, К.В.Благова
     
     ВНЕСЕН Государственным комитетом СССР по науке и технике
     
     Член Комитета Н.Б.Арутюнов
     
     УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Государственного комитета СССР по стандартам от 28 марта 1985 г., N 931
     
     
     Настоящий стандарт устанавливает правила представления поисковых образов документов (ПОД) на магнитной ленте с записями в коммуникативном формате по ГОСТ 7.19-85.
     
     Стандарт распространяется на ПОД, выраженные средствами информационно-поисковых языков (ИПЯ) с лексическими единицами на естественном языке (средствами вербальных ИПЯ). Правила построения ПОД на ИПЯ классификационного типа установлены в ГОСТ 7.19-85.
     
     В настоящем стандарте используются термины по ГОСТ 7.14-84, ГОСТ 7.19-85, ГОСТ 7.25-80, ГОСТ 7.27-80 и ГОСТ 7.39-82, а также приведенные в справочном приложении.
     
     

1. ОБЩИЕ ПОЛОЖЕНИЯ

     
     
     1.1. Каждая библиографическая запись в коммуникативном формате должна содержать ПОД, состоящий из лексических единиц одного из следующих типов: дескрипторы, ключевые слова, предметные рубрики. Допускается в пределах одной записи применять ПОД, включающие лексические единицы разных типов.
     
     1.2. Лексические единицы (ЛЕ) в ПОД и их синтаксические конструкции снабжают специальными пометами, характеризующими их семантику и структуру.
     
     1.3. Дескрипторы и предметные рубрики сопровождаются информацией о словаре, использованном при индексировании.
     
     

2. СТРУКТУРА ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА

     
     
     2.1. ПОД из ключевых слов или дескрипторов имеет структуру:
     
     линейную (простой перечень ЛЕ с соблюдением или без соблюдения алфавитного порядка),
     
     иерархическую (с синтаксическими конструкциями двух или более уровней иерархии).
     
     В ПОД с иерархической структурой отдельные ЛЕ образуют исходный нижний уровень иерархии. Объединение ЛЕ (условно "предложение") образует второй уровень. Объединение предложений (условно "абзац") образует третий уровень. Количество уровней иерархии не ограничено.
     
     Структурированный ПОД состоит из синтаксических конструкций (объединений ЛЕ) одного или разных уровней иерархии, а также наряду с синтаксическими конструкциями может включать отдельные ЛЕ.
     
     Примеры:
     
     1. ПОД состоит из простого перечня ЛЕ: А А А А
     
     2. ПОД состоит из предложений: (АА) (АА) (АА)
     
     3. ПОД состоит из абзацев: ((АА) (АА)) ((АА) (АА))
     
     4. ПОД состоит из предложения и отдельных ЛЕ: (АА) ААА
     
     5. ПОД состоит из абзаца и предложения: ((АА) (АА)) (ААА)
     
     6. ПОД состоит из абзаца, предложения и отдельной ЛЕ: ((АА) (АА)) (АА) А
     
     2.2. ПОД на языке предметных рубрик всегда имеет иерархическую структуру. Лексическими единицами ПОД на языке предметных рубрик являются предметные заголовки и уточняющие их предметные подзаголовки различного уровня иерархии. Форма их представления и взаимное подчинение заданы словарем (списком) предметных рубрик.
     
     Пример: ПОД состоит из двух предметных рубрик (Р). Первая рубрика включает заголовок (З) и подзаголовок (ПЗ). Вторая рубрика включает заголовок, подзаголовок и подподзаголовок (ППЗ).
     
     Р-ПЗ
     Р-ПЗ- -ППЗ
     
     2.3. Данные, относящиеся к одному дескриптору, записывают в одном поле с меткой , которое может содержать подполя согласно п.3.2. Каждое поле с меткой  должно содержать один дескриптор и не более одного вхождения каждого из прочих подполей, которые расположены в порядке, указанном в п.3.2.
     
     2.4. Данные, относящиеся к одному ключевому слову, записывают в одном поле с меткой , которое может содержать подполя согласно п.3.3. Каждое поле с меткой  должно содержать одно ключевое слово и не более одного вхождения каждого из прочих подполей, которые расположены в порядке, указанном в п.3.3.
     
     2.5. Каждый предметный заголовок, подзаголовок или подподзаголовок предметной рубрики записывают в отдельном поле с меткой  согласно п.3.4. Связь отдельных элементов сложной рубрики выражается иерархическим кодом. Каждое поле с меткой  должно содержать одну предметную рубрику и не более одного вхождения каждого из прочих подполей, которые располагают в порядке, указанном в п.3.4.
     
     2.6. Данные о связи ЛЕ, а также информационный вес синтаксических конструкций записывают в полях данных с меткой  согласно п.3.5. Каждой синтаксической конструкции (каждой вершине графа синтаксических связей) соответствует отдельное поле, содержащее два подполя с идентификаторами Е и N, которые расположены в порядке, указанном в п.3.5.
     
     2.7. В пределах ПОД рекомендуется при каждой ЛЕ приводить одинаковый набор подполей.
     
     

3. СПЕЦИФИКАЦИЯ ЭЛЕМЕНТОВ ДАННЫХ, ФОРМИРУЮЩИХ ПОД

     
     
     3.1. Для идентификации элементов данных ПОД в соответствии с ГОСТ 7.19-85 используют метку, порядковый номер элемента данных в подзаписи (второй и третий символ части справочника, определяемой при применении), индикатор и идентификатор.
     
     Индикатор для элементов данных ПОД принимает значение  (пробел).
     
     В настоящем разделе элементы данных описываются в следующем порядке:
     
     обозначение элемента данных: метка, индикатор и идентификатор (его второй символ),
     
     наименование элемента данных,
     
     признак обязательности (О - обязательный, Н - необязательный),
     
     пояснение содержания,
     
     способ записи,
     
     пример записи.
     
     Примеры записи даны в табличной форме, где указано содержание компонентов справочника (метка и порядковый номер поля данных) и полей данных (индикатор, идентификатор и содержание элемента данных).
     
     3.2. Спецификация элементов данных поля с меткой
     
     Перечень подполей с меткой  и порядок их следования в записи указан в табл. 1.
     
     

Таблица 1

     


Идентификатор


Наименование элемента данных

C

Дескриптор тезауруса

E

Код дескриптора

N

Иерархический код дескриптора

S

Дополнительная информация о дескрипторе

A

Наименование тезауруса

M

Регистрационный номер тезауруса в АСВИЯ

          
    С ДЕСКРИПТОР ТЕЗАУРУСА (О - если ПОД получен контролируемым индексированием по тезаурусу)
     
     Лексическая единица (дескриптор), взятая из тезауруса (дескрипторного словаря).
     
     Способ записи. На естественном языке в соответствии со словарем-источником. Каждый дескриптор записывается в поле, включающем также элементы данных А и/или М.
     
     Пример. ПОД состоит из дескрипторов, взятых из тезауруса с регистрационным номером 32.78: микро-ЭВМ, интерфейсы, стандарты, физика высоких энергий.
     


Компоненты справочника


Поля данных

1

 

C

микро-ЭВМ

  

  

M

32.78

2

 

С

интерфейсы

  

  

М

32.78

3

 

С

стандарты

  

  

М

32.78

4

 

С

физика высоких энергий

  

  

М

32.78

     
    Е КОД ДЕСКРИПТОРА (Н)
     
     Код дескриптора в соответствии с используемым словарем ИПЯ. В коммуникативном формате может употребляться только с элементом данных С "Дескриптор тезауруса".
     
     Способ записи. В виде, представленном в словаре. Подполе входит в состав поля, в котором записан дескриптор (элемент данных С).
     
    N ИЕРАРХИЧЕСКИЙ КОД ДЕСКРИПТОРА (О - при записи структурированного ПОД)
     
     Код, обозначающий место дескриптора в иерархии ПОД.
     Способ записи. В подполе N поля  соответствующего дескриптора в структуре K NN?N?N, где
     
     K - десятичная цифра, обозначающая число уровней иерархии в синтаксической конструкции,
     
     i = 1,2,3?, K - номер уровня иерархии, начиная с верхнего.
     
     N - двузначные коды (из множества , ,?, 99, ,?, ZZ), обозначающие порядковые номера синтаксических конструкций i-го уровня иерархии, подчиненных одной вышестоящей конструкции (например, порядковый номер ЛЕ в предложении или предложения в абзаце).
     
     Пример. Двухуровневый ПОД состоит из пяти дескрипторов, образующих два предложения:
     
     первое предложение - программное обеспечение, компиляторы программ
     
     второе предложение - грамматический разбор, К-грамматики, применение
     


Компоненты справочника


Поля данных

1

 

C

программное обеспечение

  

  

N

211

  

  

M

32.78

2

 

С

компиляторы программ

  

  

N

212

  

  

М

32.78

3

 

С

граматический разбор

  

  

N

221

  

  

М

32.78

4

 

С

К-грамматики

  

  

N

222

  

  

М

32.78

5

 

С

применение

  

  

N

223

  

  

М

32.78

     
   S ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ О ДЕСКРИПТОРЕ (H)
     
     Характеристики дескриптора, представленные в табл. 2.
     
     Способ записи. В виде 6-символьного кода в соответствии с табл. 2 в поле соответствующего дескриптора. При отсутствии информации в позициях кода проставляется  (пробел).
     
     Пример. Дескриптор "приусадебное хозяйство" является наименованием журнала и найден в тезаурусе при ручном индексировании данного журнала.
     


Компоненты справочника


Поле данных

1

 

C

приусадебное хозяйство

  

  

S

IS113

  

  

M

53.82

     
     
Таблица 2

     


Наименование характеристики


Позиция кода


Код характеристики


Значение характеристики

Семантическая

1

I

Имя собственное (идентификатор)

характеристика

  

T

Термин

  

  

P

Наименование параметра

  

  

V

Значение параметра

  

  

M

Число

  

  

E

Единица величины

Морфологическая

2

F

Фрагмент слова

характеристика

  

A

Простое слово

  

  

C

Сложное слово

  

  

S

Словосочетание

  

  

B

Аббревиатура

Роль в ПОД

3

 

Объект исследования, изобретения

  

  

1

Характеристики, свойства, параметры объекта

  

  

2

Методы и средства исследования, технологическая оснастка

  

  

3

Составные части, узлы, детали объекта

  

  

4

Область применения объекта

  

  

5

Назначение объекта

  

  

6

Цель исследования, разработки

  

  

7

Результаты исследования, разработки

Роль ЛЕ в конструкции

4

K

Опорная ЛЕ конструкции (используется как входное слово предметных указателей)

  

  

H

Второстепенная ЛЕ конструкции (определитель)

  

  

F

При данной ЛЕ имеется фактографическая информация

Информационный вес ЛЕ в документе

5

3

Главный элемент (понятие, термин)

  

  

2

Определитель главного элемента

  

  

1

Второстепенный элемент

  

  

 

Отрицательный вес (в документе отсутствуют соответствующие данные)

Способ получения

6

1

ЛЕ назначена индексатором

ЛЕ

  

2

ЛЕ получена при автоматическом индексировании

  

  

3

ЛЕ приписана при избыточном индексировании

          
    А НАИМЕНОВАНИЕ ТЕЗАУРУСА (О - при записи ПОД на основе словаря, не зарегистрированного в АСВИЯ)
     
     Наименование словаря-источника на естественном языке.
     
     Способ записи. В соответствии с титульным листом словаря.
     
    М РЕГИСТРАЦИОННЫЙ НОМЕР ТЕЗАУРУСА В АСВИЯ (О - при записи ПОД на основе словаря, зарегистрированного в АСВИЯ).
     
     Регистрационный номер словаря-источника, присвоенный Центральной службой АСВИЯ.
     
     Способ записи. Элемент данных записывается в структуре ННН.ГГ
     
     (ННН - порядковый номер регистрации, ГГ - две последних цифры года регистрации).
     
     Пример. Индексирование проводилось по тезаурусу, который имеет регистрационный номер 534.82
     


Компоненты справочника


Содержание подполя

1

М 534.82

     
     3.3. Спецификация элементов данных поля с меткой

     Перечень подполей поля с меткой  и порядок их следования в записи указаны в табл. 3.
     
     

Таблица 3

     


Идентификатор


Наименование элемента данных

A

Ключевое слово (КС)

N

Иерархический код КС

S

Дополнительная информация о КС

C

Язык КС

          
    А КЛЮЧЕВОЕ СЛОВО (О - если ПОД получен свободным индексированием)
     
     Слово или словосочетание естественного языка, представляющее собой отдельную лексическую единицу ПОД.
     
     Способ записи. На естественном языке в нормализованном виде по ГОСТ 7.25-80 в соответствии с индексируемым документом: в том же алфавите с сохранением пробелов, знаков препинания, цифр и специальных знаков. Примеры приведены в описании элемента данных С.
     
    N ИЕРАРХИЧЕСКИЙ КОД КЛЮЧЕВОГО СЛОВА (О - при записи структурированного ПОД)
     
     Код, обозначающий место ключевого слова в иерархии ПОД.
     
     Способ записи и пример аналогичны приведенным в описании элемента данных N.
     
    S ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ О КЛЮЧЕВОМ СЛОВЕ (Н)
     
     Характеристики ключевого слова, представленные в табл. 2.
     
     Способ записи аналогичен приведенному в описании элемента данных S.
     
     Пример. ПОД содержит одно предложение и два отдельных ключевых слова:
     

 

     
     Примечание. ПОД представляется в виде однородных синтаксических конструкций (предложений). Первое предложение содержит два ключевых слова, второе и третье предложения содержат по одному ключевому слову.
     


Компоненты справочника


Поля данных

1

 

A

конференции

  

  

N

211

  

  

S

2

2

 

A

Париж

  

  

N

212

  

  

S

1

3

 

A

обработка данных

  

  

N

221

  

  

S

1

4

 

A

программное обеспечение

  

  

N

231

  

  

S

1

     
    С ЯЗЫК КЛЮЧЕВОГО СЛОВА (О - если язык ключевого слова отличен от языка библиографической записи)
     
     Язык, на котором записаны ключевые слова ПОД.
     
     Способ записи и пример приведены в описании элемента данных 11А "язык основного текста документа" в ГОСТ 7.19-85. Элемент данных записывают в поле соответствующего ключевого слова.
     
     3.4. Спецификация элементов данных поля с меткой 67
     
     Перечень подполей поля с меткой 67 и порядок их следования в записи указаны в табл. 4.
     
     

Таблица 4

     


Идентификатор


Наименование элемента данных

В

Предметная рубрика

N

Иерархический код предметных рубрик

С

Наименование словаря предметных рубрик

М

Регистрационный номер словаря предметных рубрик

     
     
     67В ПРЕДМЕТНАЯ РУБРИКА (О - при индексировании по словарю предметных рубрик)
     
     Заголовок или подзаголовок предметной рубрики.
     
     Примечание. Предметные рубрики могут состоять из заголовка и уточняющих его подзаголовков 1, 2, 3-го и более глубоких уровней иерархии. Каждый уровень иерархии предметной рубрики содержит не более одной ЛЕ. Формат не ограничивает глубину иерархии предметных рубрик.
     
     
     Способ записи. В соответствии со словарем-источником. Каждая ЛЕ предметных рубрик записывается в отдельном поле.
     
     Пример. ПОД включает одну простую предметную рубрику "Аккумуляторы", являющуюся заголовком и не имеющую подзаголовков:
     


Компоненты справочника


Поле данных

1

 

B

Аккумуляторы

     
     67 ИЕРАРХИЧЕСКИЙ КОД ПРЕДМЕТНОЙ РУБРИКИ (О - при индексировании по словарю предметных рубрик)
     
     Код, обозначающий место лексической единицы в иерархии предметной рубрики.
     
     Способ записи. В виде трехсимвольного кода в подполе поля соответствующей ЛЕ в структуре РУУ
     
     (Р - односимвольный порядковый номер рубрики в ПОД,
     
     УУ - двухсимвольный номер уровня иерархии ЛЕ в предметной рубрике).
     
     При этом нумерация уровней иерархии ведется от уровня заголовка предметной рубрики, которому присваивается номер .
     
     Пример. ПОД включает две предметные рубрики, имеющие подзаголовки:
     
     Торф - Влажность - Измерение
     
     Торф - Брикетирование
     


Компоненты справочника


Поле данных

1

 

B

Торф

  

  

N

1

2

 

B

Влажность

  

  

N

11

3

 

B

Измерение

  

  

N

12

4

 

B

Торф

  

  

N

2

5

 

B

Брикетирование

  

  

N

21

     
    С НАИМЕНОВАНИЕ СЛОВАРЯ ПРЕДМЕТНЫХ РУБРИК (О - при индексировании по словарю предметных рубрик).
     
     Описание аналогично элементу данных С.
     
    М РЕГИСТРАЦИОННЫЙ НОМЕР СЛОВАРЯ ПРЕДМЕТНЫХ РУБРИК (О - при наличии регистрационного номера АСВИЯ).
     
     Описание аналогично элементу данных M.
     
     3.5. Спецификация элементов данных поля с меткой 42
     
     Перечень подполей поля с меткой, применяемых для представления ПОД, и порядок их следования в записи указаны в табл. 5.
     
     

Таблица 5

     


Идентификатор


Наименование элемента данных

E

Характер отношения между элементами данных

N

Характер отношения между ЛЕ в ПОД

     
     
     42Е ХАРАКТЕР ОТНОШЕНИЯ МЕЖДУ ЭЛЕМЕНТАМИ ДАННЫХ (Н)
     
     В соответствии с ГОСТ 7.19-85 содержит символ 4 для обозначения связи ЛЕ.
     
     42N ХАРАКТЕР ОТНОШЕНИЯ МЕЖДУ ЛЕ В ПОД (Н)
     
     Дополнительная информация о характере отношения между ключевыми словами и/или дескрипторами ПОД, а также об информационном весе синтаксической конструкции.
     
     Способ записи. В виде трехсимвольного кода, позиции которого заполняют по табл. 6, сопровождаемого адресами характеризуемых элементов данных, записываемыми вслед за трехсимвольным кодом и отделяемыми от него и друг от друга пробелом. Адресом ЛЕ является метка 63 или 64 с порядковым номером поля данных. Адресом синтаксической конструкции является метка 42 с порядковым номером поля данных. При отсутствии соответствующих данных в позициях трехсимвольного кода проставляется  (пробел).
     
     Пример 1. Характеризуются отношения между третьим, четвертым и пятым ключевым словом ПОД. Отношение является связью компонентов в параметрической конструкции.
     


Компоненты справочника


Поле данных

1

  E4  N  E  3    4    5

     
     Пример 2. Вторая и третья ЛЕ дескрипторного ПОД являются синонимами.
     


Компоненты справочника


Поля данных

2

  E4  N  C  2    3

     
     Пример 3. Синтаксическая конструкция типа абзац образована первым и вторым предложением, а также включает пятый дескриптор. Конструкция характеризуется как главный элемент ПОД.
     


Компоненты справочника


Поле данных

3

  E4  N  3  1    2    5

     
     
Таблица 6

     
Характер отношения между ЛЕ

     


Наименование характеристики


Позиция кода


Код
характеристики


Значение характеристики

Синтаксическая связь

1

С

Содержательная неинтерпретированная связь

  

  

D

Порядковая связь (указывать не обязательно)

  

  

F

Связь фрагментов лексической единицы

  

  

E

Связь компонентов параметрической конструкции

  

  

А

Связь типа "объект-характеристика"

Парадигматические отношения

2

С

Синонимия

  

  

В

Связь опорной ЛЕ с вышестоящей по иерархии словаря индексирования

  

  

Н

Связь опорной ЛЕ с нижестоящей по иерархии словаря индексирования

  

  

А

Ассоциация

Информационный
вес синтаксической
конструкции

3

3

Главный элемент (ключевая
конструкция)



2

Определитель главного элемента



1

Второстепенный элемент (неключевая конструкция)



 

Отрицательный вес

     
     

4. ПРЕДСТАВЛЕНИЕ ДАННЫХ В ЗАПИСИ

     
     
     4.1. При записи ПОД используют наборы символов и методы кодирования по ГОСТ 7.19-85. Не допускается заменять коды знаков одного алфавита кодами сходных по начертанию знаков другого алфавита.
     
     4.2. В тех случаях, когда ПОД содержит дескрипторы или предметные рубрики, взятые из одного и того же словаря, либо ключевые слова, относящиеся к одному и тому же языку, достаточно указывать элементы данных A, М, М и С только при первой лексической единице данного типа в записи.
     
     Пример. ПОД, приведенный в примере к описанию элемента данных С, допускается представлять в следующем виде.
     


Компоненты справочника


Поля данных

1

 

C

микро-ЭВМ

  

  

M

32.78

2

 

C

интерфейсы

3

 

C

стандарты

4

 

C

физика высоких энергий

     
     4.3. В качестве идентификаторов и кодов характеристики лексических единиц, установленных настоящим стандартом, применяют цифры и прописные буквы латинского алфавита.
     

ПРИЛОЖЕНИЕ
Справочное

     
ПОЯСНЕНИЯ К ТЕРМИНАМ, ПРИМЕНЯЕМЫМ В СТАНДАРТЕ

     
     Вербальный ИПЯ - информационно-поисковый язык, для представления лексических единиц которого используются слова или выражения естественного языка.
     
     Иерархический код - элемент данных, выраженный кодом, определяющим положение лексической единицы или синтаксической конструкции в иерархической структуре ПОД.
     
     Структурированный ПОД - поисковый образ документа, записанный при помощи ИПЯ, использующего объединение лексических единиц в синтаксические конструкции.
     
     Синтаксическая конструкция ПОД - объединение двух или более лексических единиц ПОД, которые при поиске информации должны рассматриваться совместно или в связи друг с другом. Синтаксические конструкции могут включать в себя синтаксические конструкции нижнего уровня и входить в конструкции верхнего уровня.
     
     Отдельные ЛЕ также могут быть рассмотрены как вырожденные синтаксические конструкции.
     
     АСНТИ - автоматизированная система научно-технической информации.
     
     ГАСНТИ - Государственная автоматизированная система научно-технической информации.
     
     АСВИЯ - Автоматизированная система ведения информационных языков.
     
     
     
     Текст документа сверен по:
     официальное издание
     Госстандарт СССР -
     М.: Издательство стандартов, 1985