Для поділу уявлення БД була створена трирівнева архітектура ANSI-SPARK.
Дана модель дозволяє стандартним чином описати особливості функціонування СУБД, виділяючи при цьому 3 рівня: зовнішнього (загального). концептуального (логічного) і внутрішнього (фізичного).
Мета - відділення для користувача подання БД від її фізичної реалізації.
Зовнішній рівень - представлення БД з точки зору користувача. Описує частина БД, що відноситься до конкретного користувача. Складається з зовнішнього подання БД, кожна вистава - ведення предметної сутності користувача і містить тільки ті сутності, атрибути та зв'язку, які цікаві цьому користувачеві.
Концептуальний рівень - узагальнююче уявлення БД, описує, які дані зберігаються в БД, відображає зв'язки між ними. Містить повну структуру БД, яка буде показувати вимоги організації. Концептуальний рівень включає в себе поняття об'єктів бази даних (таких як ключі, таблиці, індекси, уявлення і тп) без урахування їх внутрішньої організації.
Внутрішній рівень - фізичне представлення БД в ЕОМ. Описує зберігання інформації в БД, відомості про розміщення, стисненні і методах шифрування. Внутрішній рівень займається управлінням файлами і файловими групами, сторінками файлів даних, організацією таблиць і індексів, управлінням роботою з екстенти і відстеженням вільного місця.
Сукупність схем усіх рівнів називається схемою бази даних. В архітектурній моделі ANSI / SPARC передбачається наявність в СУБД механізмів, що забезпечують междууровневое відображення даних "зовнішній - концептуальний" і "концептуальний - внутрішній". Функціональні можливості цих механізмів забезпечують абстракцію даних і визначають ступінь незалежності даних на всіх рівнях.
Поняття схеми і підсхеми
Структуру даних необхідно описувати формалізованим чином. Описи логічної і фізичної структур БД використовується програмними засобами управління БД при обробці вимог користувачів на отримання тієї інформації, яку містить БД. Опис логічної структури БД називається схемою. Схема являє собою таблицю типів використовуваних даних. Вона містить імена об'єктів і їх атрибути і вказує на існуючу між ними зв'язок. Якщо схема містить значення елементів даних, її називають екземпляром схеми. Сам термін схема використовується для визначення повної таблиці всіх типів елементів даних і типів записів, збережених у БД.
Подсхема це частина схеми, яка грунтується на поданні даного користувача про модель даних. Таким чином, на основі однієї схеми можна отримати різні підсхеми.
Часто схеми і підсхеми представляють у вигляді діаграм (і тут звичайно можна про них трохи розповісти, але з цим самостійно впоратися навіть зовсім дубовий студент). Зв'язки на схемі можуть забезпечувати передачу такої інформації, яка не представлена конкретними елементами даних, показаними на схемі.
Моделі даних (ER, семантична, об'єктна, логічна, фізична моделі)
Модель даних це формальна теорія подання та обробки даних в системі управління базами даних (СКБД), яка включає, щонайменше, три аспекти:
- аспект структури: методи опису типів і логічних структур даних в базі даних;
- аспект маніпуляції: методи маніпулювання даними;
- аспект цілісності: методи опису і підтримки цілісності бази даних.
Семантична модель - це модель предметної області, призначена для представлення семантики предметної області на найвищому рівні абстракції. Найбільш відомим поданням класу семантичних моделей є ER-модель.
Фізична модель БД визначає спосіб розміщення даних на носіях (пристроях зовнішньої пам'яті), а також спосіб і засоби організації ефективного доступу до них.
Ієрархічна модель даних
Ієрархічна модель даних - це уявлення бази даних у вигляді дерева (ієрархічної) структури, що складається з об'єктів (даних) різних рівнів. Між об'єктами існують зв'язки, кожен об'єкт може включати в себе кілька об'єктів нижчого рівня. Перші СУБД використовували ієрархічну модель. Ієрархічна БД складається з упорядкованого набору дерев.
В рамках ієрархічної моделі виділяють мовні засоби опису даних (МОД) і засоби маніпулювання даними (ЯМД). Кожна фізична база описується набором операторів, що обумовлюють як її логічну структуру, так і структуру зберігання БД. При цьому спосіб доступу встановлює спосіб організації взаємозв'язку фізичних записів.
Визначено такі способи доступу: ієрархічно послідовний, ієрархічно індексного-послідовний, ієрархічно прямий, ієрархічно індексного-прямої, індексний.
В ієрархічній моделі автоматично підтримується цілісність посилань між предками і нащадками. Основне правило: ніякої нащадок не може існувати без свого батька.
Мережева модель даних
Мережева модель даних - логічна модель даних, що є розширенням ієрархічного підходу, сувора математична теорія, що описує структурний аспект, аспект цілісності і аспект обробки даних в мережевих базах даних.
Різниця між ієрархічною моделлю даних і мережевий полягає в тому, що в ієрархічних структурах запис-нащадок повинна мати в точності одного предка, а в мережевій структурі даних у нащадка може бути будь-яке число предків.
Мережева БД складається з набору примірників певного типу записи і набору примірників певного типу зв'язків між цими записами.
Тип зв'язку визначається для двох типів запису: предка і нащадка. Примірник типу зв'язку складається з одного примірника типу записи предка і упорядкованого набору примірників типу записи нащадка.
Переваги: висока ефективність оперативності, низькі витрати пам'яті. Недоліки: складність, "жорсткість" вимог вихідний БД.
Реляційна модель даних
Термін «реляційний» означає, що теорія заснована на математичному понятті відношення (relation).
Реляційна модель даних (РМД) - логічна модель даних, прикладна теорія побудови баз даних, яка є додатком до завдань обробки даних таких розділів математики як теорії множин і логіка першого порядку.
На реляційної моделі даних будуються реляційні бази даних.
Реляційна модель даних включає наступні компоненти:
- Структурний аспект (складова) - дані в базі даних є набором відносин.
- Аспект (складова) цілісності - відносини (таблиці) відповідають певним умовам цілісності. РМД підтримує декларативні обмеження цілісності рівня домену (типу даних), рівня відносини і рівня бази даних.
- Аспект (складова) обробки (маніпулювання) - РМД підтримує оператори маніпулювання відносинами (реляційна алгебра, реляційне числення).
Крім того, до складу реляційної моделі даних включають теорію нормалізації.
Схема відносини БД - це іменоване безліч пар. Схема БД (в структурному сенсі) - це набір іменованих схем відносин.
Ставлення - це безліч кортежів даної бази даних, які відповідають одній схемі відносини. Іноді, щоб не плутатися, говорять «ставлення-схема» і «ставлення-екземпляр", іноді схему відносини називають заголовком відносини, а відношення як набір кортежів - тілом відносини.
У табличній формі уявлення відносин, схема відносини - це не що інше, як рядок заголовків стовпців.
Кортеж. що відповідає даній схемі відносини в базі даних, - це безліч пар, яке містить одне входження кожного імені атрибута, що належить схемою відносини.
Число атрибутів щодо називають ступенем (або -арностью) відносини. Потужність безлічі кортежів відносини називають потужністю відносини.
Фундаментальні властивості відносин: відсутність кортежів-дублікатів, відсутність впорядкованості кортежів, відсутність впорядкованості атрибутів, атомарность значень атрибутів.