1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются




Название1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются
страница2/9
Дата конвертации06.02.2016
Размер1.14 Mb.
ТипДокументы
источникhttp://djbelyak.scienceontheweb.net/wordpress/wp-content/uploads/2011/06/Ответы-к-экзамену-по-БД
1   2   3   4   5   6   7   8   9

2.Нормативно – методические документы по созданию базы данных


. В настоящее время в стране разработано более 40 общероссийских классификаторов социально- и технико- экономической информации, которые можно использовать при создании БД. Например:

    • общероссийский классификатор стандартов (ОК 001-93, ОК 014-94);

    • общероссийский классификатор предприятий и организаций - ОКПО (ОК 007-93);

    • общероссийский классификатор экономических районов (ОК 008-93);

    • общероссийский классификатор единиц измерений (ОК 015-94);

    • общероссийский классификатор информации о населении (ОК 018-95);

    • общероссийский классификатор объектов административно - территориального деления и населенных пунктов - CОАТО (ОК 019 -95);

    • отраслей промышленности (ОКОНХ);

    • органов государственного управления (СООГУ) и некоторые другие.

ГОСТ 7.70-96 Описание баз данных и машиночитаемых информационных массивов.

При создании информационных систем необходимо использовать единый государственный кадастр (ЕГК) РФ - систематизированный на единой географической основе свод документальных данных, представляющих комплексную информацию о природных ресурсах, недвижимости, экологии и социально-экономических условиях, и базирующихся на действующих отраслевых кадастрах и других ведомственных и территориальных системах учета. Область распространения ЕГК - территория РФ, континентальный шельф, акватории морей и океанов, и воздушное пространство над ними, где проводится хозяйственная или иная деятельность в интересах РФ. ЕГК предназначен для обеспечения органов государственной власти органов местного самоуправления, предприятий, учреждений, организаций, иных юридических лиц и граждан достоверной информацией о среде обитания и хозяйственной деятельности. В настоящее время разработаны следующие кадастры:

    • Государственный земельный кадастр;

    • Государственный лесной кадастр;

    • Государственный водный кадастр (ГВК);

    • Государственный кадастр месторождений и проявлений полезных ископаемых;

    • Государственный кадастр животного мира;

    • Государственный кадастр особо охраняемых природных территорий (ООПТ)

· Перечень объектов исторического и культурного наследия федерального (общероссийского) значения (ИНК).

В связи с развитием Геоинформационных систем (ГИС) особую роль приобретает стандартизация условных обозначений на карте. В семидесятых годах была проведена большая работа по стандартизации терминов в области природной среды - была выпущена серия ГОСТ Термины и определения.

В качестве международных стандартов качества рассматриваются стандарты серии ISO 9000.


3. Access: Выделение, замена, копирование данных

Ctrl+A;Ctrl+C;Ctrl+V;Ctrl+X


4

1.Понятия схемы и подсхемы, логический и физический уровни представления данных

Первая лабораторная работа – это фактически логическое представление – на уровне проектирования, сам проект. А физическое представление – это то, что мы потом реализуем.

Схема – коллекция объектов БД, содержащих таблицы, индексы, кластеры, представления, снимки – журналы репликации, последовательности, синонимы, пакеты. При проектировании больших БД выделяются подсхемы. Объекты схемы – это абстракция (логическая структура) составляющих базы данных.

База данных разделяется на одно или более логических частей, называемых табличными пространствами. Табличные пространства используются для логической группировки данных между собой. Сегментирование групп по табличным пространствам упрощает администрирование этих групп. Каждое табличное пространство состоит из одного или более файлов данных. Используя несколько файлов данных для одного табличного пространства, можно распределить их по разным дискам, увеличив тем самым скорость ввода–вывода и, соответственно, производительность системы. Таким образом, БД состоит из табличных пространств, которые, в свою очередь, состоят из файлов данных. А файлы данных могут быть разбросаны по нескольким физическим дискам.

Под физической структурой БД, в данном случае, подразумевается то, какие таблицы должны предоставлять нужную нам информацию и какие поля (атрибуты) должны в них входить. При проектировании физической структуры БД мы должны учитывать необходимость полноты представления данных и стремиться к исключению избыточности данных. Данные должны быть не противоречивы и представлены таким образом, чтобы все необходимые манипуляции с ними были просты и максимально эффективны. Выявив все сущности, информация о которых должна быть представлена в БД, и описав связи между ними, мы имеем логическую структуру БД.

2.Основания для классификации данных

Наиболее полное и эффективное использование информации для научной и производственной деятельности возможно при правильной и четкой организации данных и наличии хорошо проработанных и умело используемых средств поиска информации. Одним из самых полезных методов организации БД и поиска в них является классификация – традиционный метод познания, в результате применения которого знания представляются в виде некоторой схемы.

Классификация дает возможность получить представление о необходимых информационных ресурсах, программных средствах создания БД и установить связи между ними и таблицами внутри БД. Минимизация числа связей между таблицами данных, скорость поиска данных служат критериями такой классификации.

Наиболее общими характеристиками любого атрибута являются место и время их регистрации. Местом регистрации может быть точка, заданная своими координатами, географическая область, например, населенный пункт, сведения о котором могут быть представлены с разной точностью. Допустимо представление данных в любом пространственном масштабе (точка, полигон, район и т.п.). Регистрация данных отличается своей продолжительностью и рядом других временных характеристик, время их выполнения фиксируется практически всегда (год, дата, часы, минуты, секунды в зависимости от масштаба процесса).

Используя такую модель представления данных, можно выбирать данные по критериям, формулируемым по местоположению, времени, имени и значению атрибута. Например, выбрать данные для всех атрибутов по географическому району за конкретный период времени; выбрать значение атрибута за период времени по всему географическому пространству, присутствующему в БД.

Данные в зависимости от их способа представления в ЭВМ разделяются на пространственные, фактографические, графические и звуковые.

Пространственные данные представляются на карте в виде значений атрибутов, отнесенных к определенным координатам или изолиниям значений атрибутов. Пространственные данные всегда имеют географические координаты (географическая привязка).

Фактографические данные определяются местом и временем, отражают факты различных ситуаций для одной или нескольких точек, в исходном или агрегированном (осредненном для точки или района). Эти данные могут быть представлены в виде временных рядов, комплектов данных, организованных в зависимости от системы сбора данных и/или платформы, методов обработки и т.п. Фактографические данные в виде значений в узлах регулярной сетки различного пространственно – временного масштаба после их представления в виде изолиний кратных значений атрибутов среды (например, для температуры воды 00 ,50, 150, 250) становятся пространственными.

Текстовые данные – это документы, характеризующиеся библиографической информацией, представляются в текстовых редакторах.

Графические данные – это пространственная или фактографическая информация, представленная с помощью графических средств на экране (карты, графики, диаграммы, изображения). Фактически это результаты обработки исходных и модельных данных, представленные в виде графиков, диаграмм, сканированных документов. К этому типу данных относятся также фотографии, рисунки и т.п.

Звуковые данные – это звук, записанный в цифровом виде, например, записи песен или данных, введенных в ЭВМ с голоса.

Мультимедийные данные – содержат несколько типов данных. типичным примером таких данных являются html – страницы.

Некоторые типы данных могут переходить в другие типы. Например, фактографические – в пространственные, пространственные и фактографические в графические или текстовые, мультимедийные. Классифкация данных п
редставлена на рис.7.

Основания классфикации данных более детально рассмотрены в табл.14.

БД могут хранить как метаданные, так и данные, отражающие состояние объекта. Данные могут разделяться в зависимости от их сортировки, степени обработки, метода организации регистрации и т.п. Данные в зависимости от их организации (сортировки) разделяются на исходные и инвертированные (представленные в другом порядке по отношению к исходным данным). Методика создания временных рядов обуславливает создание и хранение их в виде инвертированных данных. Это обусловлено влиянием экспертов, которые внесли свои изменения и улучшили качество созданных временных рядов.

Исходные данные хранятся в виде дисциплинарных массивов или БД, их упорядоченность определяется регламентом работы используемых систем сбора данных. Создание дисциплинарных БД для различных сфер, в различных науках (предметных областях) обусловлено технологическими причинами, связанными с системами измерений.

Таблица 14

Основания для классификации данных


Основание

Объекты

Степень подготовленности к обработке

Данные на бумажных носителях (книги, бюллетени, ежемесячники, и т.п.); магнитных лентах, дискетах и др.; в массивах данных; БД

Способ и сроки передачи

Категория А. Оперативные данные, собранные через глобальную сеть телесвязи в пределах времени отсечения (1-24 ч)

Категория В. Данные, отличающиеся от категории А более продолжительным временем отсечения (от нескольких суток до двух месяцев)

Категория С. Исторические данные, собираемые с большими задержками во времени.

Способ измерения

Дистанционный, автоматический, визуальный, ручной

Регулярность наблюдений

Регулярные, регулярные синхронные, асинхронные, нерегулярные, эпизодические

Шкала измерений

Порядковая, количественная, номинальная, балльная

Инвертирование

Полностью инвертированные; выборочно – инвертированные (временные ряды); объединенно инвертированные

Агрегированные (расчетные)

Вычисленные характеристики первого рода –интерполированные, второго – вычисленные и интерполированные значения и третьего – фоновые характеристики района

Прогнозные

Краткосрочные, долгосрочные, сверхдолгосрочные

Статичность

Изменяющиеся, статические, условно–постоянные

Периодичность обработки

Регламентированные (ежедневные, ежедекадные, ежемесячные и др.), нерегламентированные

Регламент доведения до пользователя

Экстренные (сразу после обнаружения); периодические (ежечасно, ежесуточно, ежедекадно, ежемесячно); в установленные сроки

Распространение

По запросу, рассылка по списку, обмен

Использование

Информационные, справочные, информационно– справочные, рекомендации


Результаты расчетов по моделям (вычисленные значения атрибутов, интерполированные значения по пространству и времени и т.п.) также хранятся в соответствующих БД (подсхемах). Так, например, большинство данных для представления в ГИС обрабатывается путем предварительного инвертирования и дальнейшей интерполяции (расчетов) в узлы регулярной сетки различного масштаба. На этом этапе фактографические данные превращаются в пространственные.

Необходимость хранения агрегированных данных определяется также последующей возможностью сравнения результатов, полученных различными методами статистической обработки, например, в зависимости от разной длины временных рядов наблюдений, методов осреднения, интерполяции и т.п. Последний тезис показывает, что и при наличии мощных средств обработки данных в среде СУБД, когда скорость расчетов достаточна велика, необходимость хранения определенной части БД агрегированных характеристик не вызывает сомнений. Их создание позволит увеличить скорость обеспечения пользователей этими данными, исключить дублирование расчетов, уменьшить затраты машинного времени, улучшить качество расчетных характеристик, дать возможность проводить дальнейшую обработку созданных БД для агрегированных атрибутов.

По регулярности (периодичности и частоте) измерений данные бывают регулярные, регулярные синхронные, асинхронные, результаты экспериментов (данные разной регулярности измерений), нерегулярные. Регулярность определяется соответствующими наставлениями и руководствами или специальными программами измерений при экспериментальных исследованиях. Нерегулярные измерения требуют более сложных методов обработки. Космическая система наблюдений является асинхронной, но зато может обеспечить огромный поток информации с высоким разрешением по большим пространствам за короткий период времени.

Данные с точки зрения способа регистрации и кодирования делятся на три типа значения атрибутов, которые можно:

  • фиксировать с помощью систем кодирования;

  • регистрировать с помощью определенных правил, например, номера квадратов, регионов и т.п.;

  • измерять в количественной шкале, которая регистрирует значения атрибутов непосредственно в “натуральном” виде, как характеристики объекта.

Информация хранится на различных носителях: бумажных (таблицы, графики), первичных машинных носителях (дискеты, магнитные ленты), микрокопиях (микрофильмы, микрофиши), компактных дисках и др.

В зависимости от состава документов, отражающих информацию, их можно занести в БД документального, фактографического или документально–фактографического типа. Это определяется объемом неформализованной информации в документах, количеством атрибутов. Например, большинство метаданных относится к документальному типу представления.

Степень постоянства информации характеризуется временем, в течение которого она остается неизменной. По указанному признаку информация подразделяется на постоянную – статическую, условно–постоянную (хранимую и изменяемую редко). К постоянной информации относятся различные словари и кодификаторы, например, названия стран, учреждений – поставщиков и потребителей данных, атрибутов и т.п. Условно–постоянная информация сохраняет свое значение определенный период времени и делится на начальную и скорректированную. К начальной информации можно отнести сведения, первый раз зарегистрированные в БД. Соотношение объемов постоянной, условно–постоянной информации имеет большое значение при выборе организации БД.

Способы распространения информации бывают следующие: высылается по запросу, рассылается по списку, передается и получается в обмен с зарубежными странами и организациями с помощью обычной почты, факса, электронной почты, Интернета.

По функциям использования выходная продукция может быть справочной (метаданные), информационной. К метаданным относятся сведения о БД, источниках данных (измерительных системах, приборах, датчиках, платформах, организациях), сведения о средствах управления данными (программных средствах, форматах хранения данных, кодификаторах, словарях). Информационная продукция – это выборки данных по любому объекту или/и на любой момент времени.

По степени готовности к использованию для принятия решений выходная информация может быть частной, комплексной или используемой только в совокупности с другой информацией. Например, сведения о критических значениях природных явлений напрямую применяя на объектах экономики, а текущая информация о состоянии среды, как правило, используется совместно с экономической информацией о состоянии объектов.

Географическая область использования определяет локальность (используется только в пределах какого-либо географического района) или глобальность информации. Например, результаты регистрации температуры воздуха в конкретных пунктах являются локальными. В то же время среднемесячные и среднегодовые значения уровня на гидрометеорологических станциях, где наблюдения ведутся более 50 лет, необходимы для глобального использования, т.е. для изучения изменений климата.

Методами образования потоков информации являются: регистрация, т.е. получение исходных данных; преобразование их (инвертирование); получение агрегированных характеристик и прогнозных данных, которые также могут подвергаться дальнейшей обработке.

По результатам обработки данных можно получить огромное число расчетных атрибутов, поэтому стоит задача оптимизации их состава. Первым шагом решения этой задачи является создание таких БД в зависимости от стадии обработки (агрегации) данных. По этому основанию можно выделить вычисление характеристики первого, второго и третьего рода. Расчетные данные первого рода – это вычисленные характеристики на основе исходных атрибутов и известных эмпирических и теоретических формул. К расчетным данным второго рода можно отнести интерполированные значения во времени и пространстве. Расчетные данные третьего рода представляют различные уровни агрегации данных в пространстве и времени (обобщение результатов переписи населения, климатические характеристики среды, др.).
1   2   3   4   5   6   7   8   9

Похожие:

1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconМетодические рекомендации по курсу
Цель данного курса дать основные понятия теории баз данных и подходы к проектированию реляционных баз данных. Представить современные...
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconТюменская государственная академия мировой экономики, управления и права
Цель курса получение студентами знаний об этапах разработки баз данных; о перспективных направлений развития баз данных
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconРабочая программа дисциплины (модуля) б 4 «базы данных»
Целями освоения дисциплины «Базы данных» являются формирование общекультурных и профессиональных компетенций, определяющих готовность...
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconМетодика преподавания баз данных в школе учитель информатики
Выбор среды разработки информационной базы интеллектуальной системы управления. 12
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconПрограмма одобрена на заседани каф. «Системы автоматизированного проектирования»
Целью дисциплины является изучение современных технологий обработки информации с применением баз данных и субд 2
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconПрограмма работы с базой данных Blackfish sql "Книги" (books). Подкаталог delploy\database содержит базу данных, подкаталоги deploy\client и deploy\server соответственно клиентскую и серверную части приложения
Программы работы с базами данных требуют, чтобы файлы баз данных находились в каталоге D:\Database
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconҒ ылыми êIÒÀÏÕÀÍÀ зарубежные, Научные базы данных на электронных носителях
Для учебной и научно-исследовательской работы Научная библиотека предлагает воспользоваться следующими адресами полнотекстовых баз...
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются icon1. Понятие системы управления базами данных
Основная особенность субд – это наличие процедур для ввода и хранения не только самих данных, но и описаний их структуры. Файлы,...
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconКурс заочного отделения Волохов Артур Юрьевич
Применительно к системам баз данных архитектура «клиент-сервер» интересна и актуальна главным образом потому, что обеспечивает простое...
1 Основные компоненты системы баз данных Основными компонентами системы баз данных являются iconДаются задания и контрольные вопросы по выполнению основных этапов разработки базы данных
Предполагается использование практикума для изучения основ построения и использования реляционных баз данных. Поэтому значительное...
Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©kzdocs.docdat.com 2012
обратиться к администрации
Документы
Главная страница