Различные классы баз данных по предметным областям использования
Различные классы баз данных по предметным областям использования
Вступление 2
1. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ 3
1.1. Документальные и документографические БД 3
1.2. Система баз данных о продукции 6
1.3. Экономическая и конъюнктурная информация 10
1.4.Фактографические базы социальных данных 11
1.5.Базы данных транспортных систем страны 14
1.6. Справочные базы для населения и организаций. 16
1.7.Система ресурсных баз данных 17
1.8. Фактографические базы и банки научных данных 19
1.9. ФБД в области культуры и искусства 23
1.10. Лингвистические БД 24
Заключение 26
Список использованной литературы 27
Вступление
В данной работе я постарался классифицировать существующие базы данных,
а так же оценить перспективы их развития в нашей стране. Классификационным
признаком является предметная область использования. Целью данной работы
является так же анализ наиболее распространенных классов БД, получивших
распространение и применение как в нашей стране, так и за рубежом.
В данной работе не акцентируется проблема передачи данных между БД, а
лишь исследуется архитектура и общая организация самих БД.
1. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ
Рассмотрим классы БД, получившие к настоящему времени наибольшее
развитие в нашей стране. Это:
- документографические и документальные БД, создаваемые в органах НТИ
и средствах массовой информации;
- БД по промышленной, строительной и сельскохозяйственной продукции;
- БД по экономической и конъюнктурной информации (статистическая,
кредитно-финансовая, внешнеторговая);
- фактографические базы социальных данных, включающие сведения о
населении и о социальной среде;
- БД транспортных систем;
- справочные данные для населения и учреждений (энциклопедии и
справочники, расписания самолетов и поездов, адреса и телефоны граждан и
организаций и др.);
- ресурсные БД , включающие фактографическую информацию о природных
ресурсах (земля, вода, недра, биоресурсы, гидрометеорология, вторичные
ресурсы и отходы, экологическая обстановка);
- фактографические базы и банки научных данных, обеспечивающие
фундаментальные научные исследования;
- фактографические БД в области культуры и искусства;
- лингвистические БД, т.е. машинные словари разного типа и
назначения.
1.1. Документальные и документографические БД
Документографические БД содержат описания документов. В зависимости
от содержания описания различают документографические БД типов БО (только
библиографическое описание документа), БК (библиографическое описание и
ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат
или аннотация). Появились также полнотекстовые БД, содержащие полные тексты
документов, которые являются собственно документальными.
Документографические системы, как правило, строятся по двуконтурной
схеме: первый контур содержит документографическую БД и используется для
автоматизированного поиска документов, второй контур в случае необходимости
обеспечивает выдачу полного текста документа в виде копии первоисточника на
бумаге, микрофильме или выводит текст на экран с оптического диска (в
некоторых случаях с жесткого магнитного диска большой емкости).
В составе данного класса выделены следующие виды БД:
- по публикуемым научно-техническим документам ;
- по публикуемым документам в области общественных наук;
- по патентным документам;
- по отчетам по НИР, ОКР, программным средствам ;
- по материалам межотраслевого обмена (научно-техническим достижениям,
ППТО, ИЛ, каталожная, выставочная информация и т.п.);
- по стандартам и другой нормативно-технической документации;
- библиографические БД, создаваемые в библиотеках, книгоиздательских и
книготорговых организациях;
- реферативные и полнотекстовые БД по общественно-политической
информации, создаваемые средствами массовой информации;
- БД законодательной и правовой информации;
- документографические документографические по специальным видам
документов ;
- БД по архивным документам. Анализ состояния дел с ДБД различных
видов в стране показывает, что в настоящее время наибольшее развитие
получили ДБД документографического типа, главным образом, по опубликованным
документам в области научнотехнической информации, общественных наук,
патентным документам, отчетам по НИР, ОКР и другим видам документов,
созданные в рамках системы научно-технической информации.
В системе НТИ создан распределенный автоматизированный банк данных
(РБнД) общим объемом более 20 млн. записей.
Порядка 30-40% записей относятся к отечественным первоисточникам,
остальные - к зарубежным. В рамках РБнД созданы абонентские сети удаленных
пользователей, охватывающие все столицы союзных республик и основные
областные центры.
Доступ к БД предоставляется частями по жесткому расписанию. Доля
одновременно доступных БД составляет 20% общего объема БнД системы НТИ.
РБнД поддержан вторым контуром, обеспечивающим выдачу пользователям
исходных текстов документов. Однако, функционирование второго контура
системы НТИ в настоящее время не соответствует современным требованиям, так
как не обеспечивает гарантированного получения копии любого первоисточника
в приемлемые сроки.
Не в полной мере соответствует современным требованиям и актуальность
записей в РБнД системы НТИ, так как сроки поступления первоисточников в
России, обработки их и ввода в БД в совокупности составляют несколько
месяцев.
К документографическим БД НТИ тесно примыкают библиографические БД,
создаваемые в библиотеках, книгоиздательских и книготорговых организациях.
Функции этих систем совпадают почти полностью, что делает целесообразным их
объединение.
Крупным недостатком сложившейся системы следует признать полное
отсутствие полнотекстовых БД научно-технической информации, в особенности,
полнотекстовых БД стандартов и нормативно-технической документов. Однако
широкое распространение полнотекстовых БД общенормативного и нормативно-
правового характера радует.
Средствами массовой информации (в основном центральны ми) создан и
ведется ряд БнД по общественно-политической информации. Основная проблема
БнД средств массовой информации заключается в полном отсутствии координации
их создания и ведения, откуда проистекает разнобой в технологии,
технических решениях, подходах к отбору и обработке информации.
Документографические БД по специальным видам документов функционируют
для документов следующих видов:
Картографические документы - в ГБЛ и ГУГК. Эти документографические БД
представляют собой, в сущности, обычные библиографические БД. В настоящее
время объем совокупного БнД картографических документов незначителен.
- Чертежно-конструкторские и проектные документы. Документографические
БД по документам этого вида существуют на отдальных предприятиях, где они
разрабатываются, как правило, самостоятельно с использованием имеющихся
программно-аппаратных средств. В результате полученные массивы, как
правило, не совместимы между собой. Кроме того, эти массивы создаются в
интересах управления деятельностью самого предприятия, и заинтересованность
предприятия-генератора в предоставлении доступа к ним внешних потребителей
обычно отсутствуют.
По-видимому, в настоящее время вопрос о включении этих документов в
систему БД и БнД не стоит.
- Аудиовизуальные документы. В телекомпаниях существует
документографическая БД по аудиовизуальным документам Центрального
телевидения , используемая в интересах этих организаций. Теледоступ внешних
потребителей к этой БД технически осуществим, но в настоящее время не
предусматривается руководством этой организации. Формирование
документографического БнД по архивным документам фактически только
началось. Основная проблема в этом виде БнД состоит в очень большом объеме
данных, подлежащих переработке и вводу в БнД, что потребует больших затрат
и длительного времени. Задача облегчается наличием четкой структуры
архивных органов и существованием координации этой работы между ними.
В целом можно отметить, что в стране существует несколько отдельных, не
связанных между собой систем документографических БнД и отдельных БД этого
класса, между которыми не всегда обеспечивается совместимость даже по
данным. Планомерное и скоординированное развитие таких систем можно
отметить только внутри следующих подсистем: документов научно-технической
информации; по общественным наукам; патентных документов; отчетных
документов; документов межотраслевого обмена; стандартов и нормативно-
технической документов; законодательных документов; архивных документов.
Между этими подсистемами координация слаба или отсутствует.
В других подсистемах нет и внутренней координации. Вместе с тем, и в
тех подсистемах, которые развиваются планомерно, имеет место совершенно
неоправданное дублирование функций, связанное с искусственным разделением
информационных потоков по отрасли-источнику на общие документальные потоки
и потоки группы отраслей промышленности. Применительно к открытой
информации такое разделение излишне (а другая информация не относится к
области рассмотрения настоящей концепции).
Сопоставление состояния дел в стране и за рубежом в области
документографических БнД позволяет также отметить отсутствие или слабое
развитие, неорганизованность и разрозненность в России некоторых видов
документографических и документальных БнД, в том числе:
-реферативных и полнотекстовых ДБнД по статьям из центральных и
региональных периодических изданий (имеются БД по статьям "Правды" и
"Известий", не доступные внешним пользователям, а так же интернет-БД,
касающиеся некоторых московских коммерческих изданий);
- ДБнД обзорной и прогнозной экономической информации;
- ДБнД по научным статьям с индексами цитирования ;
- ДБнД по правительственным документам незаконодательного характера
(заявлениям, сообщениям для прессы, выступлениям государственных деятелей и
т.п.);
- ДБнД по программному обеспечению;
- ДБнД деловой и коммерческой информации;
- ДБнД по зарегистрированным торговым маркам и другие.
1.2. Система баз данных о продукции
Информация о продукции является основным видом технико-экономической
информации. Данные о продукции характеризуются:
- огромной и зачастую неупорядоченной номенклатурой (от 10 млн. до 1
млрд. наименований ), только в ОКП содержится 25 млн. позиций, в системе
чертежного хозяйства насчитывается до 16 млн. крепежных изделий, имеются
сведения более чем о 6 млн. химических соединений и т.п.;
- разнородностью и многофункциональностью применения и описания
продукции на всех этапах ее жизненного цикла;
- обилием свойств (признаков), характеризующих отдельные группы
продукции(до 200 признаков);
- многообразием областей применения продукции, охватывающих все сферы
народнохозяйственной деятельности;
- многочисленными и разнообразными связями между продукцией и другими
видами информации (связь с предприятиями-разработчиками и изготовителями,
комплектующими изделиями, сырьем и ресурсами, технологическими процессами,
работами и услугами , состоянием окружающей среды и т.п.);
- большим количеством и разнообразием категорий групп пользователей;
- наличием большого числа различающихся и неувязанных между собой
систем классификации и кодирования продукции (ОКП, ЕСКД, ЕТНВТ,
гармонизированная система описания и кодирования товаров, система
штрихового кодирования, отраслевые и локальные системы и т.п.);
Число пользователей системы баз данных по продукции достигает десятков
тысяч (предприятий промышленности и сельского хозяйства свыше 100 тыс.,
управляющих и исполнительных органов - свыше 50 тыс., кооперативы, арендные
и индивидуальные предприятия и т.п.).
Все это обусловлено тем, что с созданием продукции связано большинство
работ и услуг в области материального производства.
Состав и объем действующих баз данных о продукции. Отдельные
информационные массивы (баз данных, файлов ) по продукции создаются и
функционируют практически в рамках любой автоматизированной системы
управления, которые разрабатывались в последние 20-25 лет на
общегосударственном, отраслевом и республиканском уровнях и на уровне
отдельных предприятий.
По мере роста числа решаемых АСУ задач и в процессе их объединения во
взаимосвязанные комплексы в большей степени обнаруживались недостатки
позадачного подхода, причем особые трудности возникали в стране с увязкой и
совместным применением различных баз данных о продукции.
Дело в том, что в настоящее время многие министерства и ведомства,
предприятия и организации страны осуществляют сбор, хранение и обработку
информации, характеризующей отдельные стороны продукции и ее производства
(данные о наличие запасов, остатках, об излишнем оборудовании, по
ресурсосбережению, коммерческая информация, сведения о продукции
реализуемой в порядке оптовой торговли, экономические показатели
производства и поставок продукции, основные характеристики продукции и цены
на нее, данные о рекламациях и конъюнктуре рынка товаров народного
потребления, сведения об экспорте и импорте продукции, рекламациях
инозаказчиков, основные характеристики продукции зарубежных фирм,
предлагаемой на мировом рынке, сведения об отечественных, международных и
зарубежных стандартах), а так же бухгалтерский ее учет.В связи с этим
построение системы баз данных на основе сложившихся в стране совокупности
АСОД требует решения проблемы их ин формационной совместимости, например, в
виде специальных, стандартизированных, интерфейсов.
Основные принцыпы создания СБД по продукции Целью СБД по продукции
является оперативное обеспечение ей достоверной и актуальной информацией о
продукции для решения их практических задач.
СБД по продукции - это совокупность территориально распределенных
БД, содержащих взаимоувязанную информацию о различных аспектах продукции на
всех стадиях ее жизненного цикла, объединенных в информационно-
вычислительную сеть и основанную на унифицированной информационной
технологии сбора и обработки информации и обшесистемных методах и
средствах описания данных.
Базы данных о продукции организуются по однородным
группам(видам)продукции и другим объектам (предриятиям, регионам) и
включают:
- номенклатуру, эксплуатационно-технические, экономические,
эргономические и другие характеристики(показатели) изделий, отражающих их
потребительские свойства, область и условия применения, влияние на человека
и окружающую среду, заменяемость и взаимозаменяемость и т.п.;
- сведения о предприятиях-разработчиках и изготовителях продукции;
- данные о ценах и условиях поставок;
- другие данные, представляющие интерес для участников
рынка продукции.
СБД о продукции создается в целях демонополизации информационного рынка
и контроля за ценами на информацию о продукции с учетом условий перехода к
рыночной экономике.
Система баз данных реализуется в виде 2 классов БД:
- государственных БД, строящихся на основе системы государственной
каталогизации продукции, создаваемых для целей планирование и
налогообложения;
- коммерческих БД.
Государственная система каталогизации включает продукцию, выпускаемую
государственными организациями и ведомствами (министерство обороны,
министерство энергетики, министерство транспорта и др.).
Поступление информации о продукции в системе каталогизации может
строится как на административной, так и на экономической основе.
Коммерческие БД создаются на базе товарных бирж, предприятий оптовой
торговли, центров НТИ и других негосударственных предприятий.
При создании БД о продукции необходимо выделить организации, которые
порождают информацию, т.е. являются генераторами информации. Эта информация
и должна собираться и поддерживаться в актуальном состоянии в системе БД.
В качестве таких организаций могут выступать предприятия-изготовители
продукции. В системе СБД по продукции целесообразно организовать БнД по
группам однородной продукции на основе наиболее оснащенных вычислительных
центров, как существующих в отраслях и регионах, так и в создаваемых
ассоциациях, центрах и т.п.
Информационное обслуживание БД по продукции могут осуществлять
непосредственно генераторы информации, хотя целесообразней осуществлять
обслуживание в специализированных интегрированных БнД, как правило
региональных, которые также нужно создавать в существующих вычислительных
центрах субъекта федерации, наиболее подготовленных для ведения БнД.
Необходимо обеспечить доступ к существующим БнД по потребляемой продукции
инистерства обороны (с учетом режимных ограничений).
Координацию создания СБД по продукции должен осуществлять
государственный центр каталогизации продукции, который выполняет следующие
функции:
- организационно-методическое и нормативно-техническое обеспечение
Страницы: 1, 2, 3
|