реляционные базы данных

Задание 3 ЕГЭ по информатике нацелено на проверку навыков поиска и сортировки информации в реляционных базах данных. Такие базы данных представлены в формате таблиц Excel, а для работы с ними, обычно, требуется знание самых базовых функций Excel.

Для решения этой задачи выделяют несколько простых этапов:

  1. Анализ диаграммы связей (схемы) базы данных;
  2. Сопоставление диаграммы с таблицами из прилагаемого файла Excel;
  3. Выделение условий отбора данных;
  4. Отбор данных и перемещение их между таблицами встроенными функциями Excel;
  5. Выполнение арифметических и логических операций над отобранными данными для получения ответа на задание.

В данной статье мы разберемся, что такое базы данных, какие из них называются реляционными, как строятся диаграммы связей и как проводить их анализ.

Что такое базы данных?

Вспомните ваш электронный дневник в школе. В нём хранится множество самой разной информации: расписание уроков, оценки, домашнее задание. Для того, чтобы весь этот массив данных как-то структурировать, хранить и обрабатывать как раз и используются базы данных.

Можно сказать, что база данных — это организованное хранилище информации в электронном виде, которое помогает легко искать, обновлять и управлять данными.

Давайте разберемся с базами данных на простом примере. Представьте себе электронную таблицу в Excel, где каждая строка — это отдельная запись (например, урок в школе), а каждый столбец — это отдельная характеристика (например, оценка за этот урок или домашнее задание).

Название предмета Оценка Домашнее задание
Информатика 5 Решить задание 3 ЕГЭ
Математика 5 Посчитать количество монет Робота
Русский язык 4 Сочинение «Моя любимая база данных»
Физ-ра 5 Кинуть камней больше Пети
Биология 4 Проследить за Черепахой
Информатика 5 Изучить функцию ВПР()

Давайте внимательно посмотрим на таблицу выше и выделим основные элементы, которые есть у баз данных:

  1. Каждая база данных состоит из таблиц, в которых хранятся данные. Причем в одной базе данных может быть несколько таблиц.
  2. Таблицы состоят из записей, которые представляются строками этих таблиц.
  3. В каждой записи есть поля или же столбцы, которые содержат определённые данные (здесь полями являются «название предмета», «оценка», «домашнее задание»). Причем одно из полей может быть ключом.
  4. Ключ — это уникальный идентификатор (ID) каждой записи, именно они позволяют связать данные между разными таблицами. В данном примере ключами у нас являются называния предметов, которые записаны в первом столбце.

Структуру таблиц принято обозначать в виде такого прямоугольника (цвета и стили могут отличаться):

рис 1

Сверху написано название нашей таблицы, для примера назовём её «Занятия». Первым полем указывается уникальный идентификатор «Название предмета», который принято выделять среди других полей, например, иконкой ключа. Далее идут поля таблицы, у нас это — «Оценка» и «Домашнее задание».

Такие прямоугольники используются при построении диаграмм связей между таблицами и называются они «сущностями», а поля таблиц в них называются «атрибутами».

Реляционные базы данных

Рассмотренная выше таблица относится к реляционной модели данных, а совокупность таких таблиц с чётко заданными связями, будет называться реляционной базой данных.

Давайте немного расширим нашу базу данных, добавив информацию об учениках и разделим все данные на три таблицы: «Ученики», «Предметы» и «Оценки и домашние задания».

В первую таблицу внесём уникальные идентификаторы каждого ученика, их имена и классы:

ID ученика Имя Класс
101 Иван 11 «А»
102 Алиса 11 «ИТ»
103 Михаил 11 «ФМ»

Во второй таблице оставим только предметы и их идентификаторы:

ID предмета Название
ИН Информатика
МА Математика
РЯ Русский язык
ИН Информатика
ФК Физ-ра
БИ Биология

Третья таблица будет сводной, здесь укажем идентификаторы оценки, ученика, предмета, значения оценки и домашнего задания:

ID оценки ID ученика ID предмета Оценка Домашнее задание
1 101 ИН 5 Решить задание 3 ЕГЭ
2 101 МА 5 Посчитать количество монет Робота
3 102 РЯ 4 Сочинение «Моя любимая база данных»
4 103 ФК 5 Кинуть камней больше Пети
5 103 БИ 4 Проследить за Черепахой
6 103 ИН 5 Изучить функцию ВПР()

В реляционной базе данных данные организованы по принципу взаимосвязанных таблиц. В нашем примере три таблицы: «Ученики», «Предметы» и «Оценки и домашние задания». Они связаны между собой с помощью уникальных идентификаторов (ID).

Например, если нужно узнать, какую оценку получил Иван по информатике, то по ID ученика (101) и ID предмета (ИН) можно найти соответствующую запись в таблице «Оценки и домашние задания».

На диаграмме наши таблицы со связями могут выглядеть так:

рис 2

Графическое представление данных и связей между ними называется ER-диаграммой или диаграммой «сущность—связь» (Entity-Relationship Diagram). Такие диаграммы помогают систематизировать информацию и определить, как сущности и их атрибуты будут взаимодействовать друг с другом.

ER-диаграммы

Создание ER-диаграммы — это первый шаг в проектировании базы данных, где определяются все необходимые сущности, их атрибуты и связи. Это позволяет разработчикам и аналитикам чётко представлять структуру данных и планировать дальнейшую реализацию базы.

Также ER-диаграммы помогают визуализировать связи между сущностями и определять, какие ключи будут использоваться для их уникальной идентификации и связи с остальными таблицами. Например, можно увидеть, что в таблице «Оценки и домашние задания» должен быть атрибут (ID ученика), ссылающийся на таблицу «Ученики».

Возвращаясь же к ЕГЭ, то как раз в условии задания 3 вы можете встретить ER-диаграмму базы данных, с которой предстоит работать. Выглядит она примерно так:

рис 3

Давайте проанализируем эту диаграмму и поймем структуру базы данных. Видим, что здесь нам предстоит работать с тремя таблицами «Движение товаров», «Магазин» и «Товар». Они расположены на соответствующих листах в файле Excel.

Ключами в таблицах являются «ID операции», «ID магазина» и «Артикул». Таким образом, связь между таблицами у нас возможна только через атрибуты «ID магазина» и «Артикул».

То есть переместить данные из таблицы «Магазин» в «Движение товаров» можно только по «ID магазина», а из таблицы «Товар» только по атрибуту «Артикул». Реализовать такое перемещение данных в Excel можно с помощью функции ВПР().