PostgreSQL

Материал из sysadm
Перейти к навигации Перейти к поиску

Ссылки

PostgreSQL Community

Последний стабильный релиз PostgreSQL 18.1

Компоненты PostgreSQL

  • Основной процесс сервера (Postmaster) - Главный управляющий процесс, который запускает и координирует все остальные процессы PostgreSQL. Он отвечает за управление соединениями, восстановление после сбоев и поддержание общей работоспособности системы.
  • Фоновые процессы (Background Processes) - Различные процессы, работающие в фоновом режиме для выполнения основных задач, таких как:
    • Запись WAL (Write-Ahead Log) Writer - отвечает за запись из буферов памяти WAL (WAL Buffers) в файлы транзакционных логов (сегменты WAL) для обеспечения целостности данных.
    • Очистка Autovacuum Launcher/Worker - Автоматически запускает процессы VACUUM для очистки "мертвых" строк (удаленных или обновленных записей) и сбора статистики для оптимизатора запросов.
    • Контрольные точки (Checkpointer) - Периодически сбрасывает все измененные страницы данных из общей памяти на диск для обеспечения согласованности и минимизации времени восстановления.
    • Фоновые рабочие процессы (Background Workers) - Введены в более поздних версиях, используются для выполнения параллельных операций, например, при параллельном сканировании, параллельных индексах GIN и асинхронном I/O.
  • Бэкенд-процессы Backend Processes - Отдельный процесс, который создается postmaster'ом для обработки каждого клиентского соединения и выполнения запросов. Каждый процесс управляет синтаксическим анализом, планированием и выполнением SQL-запросов.
  • Разделяемая память (Shared Memory) - Область памяти, доступная для всех процессов PostgreSQL. Ключевые ее части:
    • Разделяемые буферы (Shared Buffers) - Основной кэш, где хранятся блоки данных, считанные с диска, для ускорения повторного доступа.
    • Буферы WAL (WAL Buffers) - Временное хранилище для записей WAL перед их записью на диск.
    • Кэш системных каталогов - Кэширование информации о структуре базы данных.
  • Физическое хранилище данных (Data Directory/Storage) - Каталог на диске, где хранятся все физические файлы базы данных, включая файлы данных (heap files), файлы индексов, файлы WAL и системные каталоги (системную метаинформацию).

Эти компоненты совместно обеспечивают надежное хранение, извлечение и обработку данных в PostgreSQL

Установка на Rocky Linux

  1. установите пакет официального репозитория PostgreSQL
  2. установите из репозитория PostreSQL нужной версии
  3. Инизиализируйте базу
# повышение привилегий до root
sudo -s

# установка пакета официального репозитория
dnf install https://download.postgresql.org/pub/repos/yum/reporpms/EL-10-x86_64/pgdg-redhat-repo-latest.noarch.rpm

dnf repolist
#---------------------------------------------------------------------------------------------------
...
pgdg-common   PostgreSQL common RPMs for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
pgdg13        PostgreSQL 13 for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
pgdg14        PostgreSQL 14 for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
pgdg15        PostgreSQL 15 for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
pgdg16        PostgreSQL 16 for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
pgdg17        PostgreSQL 17 for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
pgdg18        PostgreSQL 18 for RHEL / Rocky Linux / AlmaLinux 10 - x86_64
...
#---------------------------------------------------------------------------------------------------

dnf install postgresql18-server

# инициализация кластера баз данных (здесь слово кластер означает совокупность базы данных)
/usr/pgsql-18/bin/postgresql-18-setup initdb

systemctl enable postgresql-18
systemctl start postgresql-18
systemctl status postgresql-18

# проверка сервисной учетки postgres
id postgres
 uid=26(postgres) gid=26(postgres) группы=26(postgres)

passwd -S postgres
 postgres L 2025-12-05 -1 -1 -1 -1

# выход из root
exit

Проверка подключения

# вход под пользователем postgres
sudo su -l postgres

# подключение к кластеру баз данных
psql

#---------------------------------------------------------------------------------------------------
# список баз данных
postgres-# \l
                                                       Список баз данных
    Имя    | Владелец | Кодировка | Провайдер локали | LC_COLLATE  |  LC_CTYPE   | Локаль | Правила ICU |     Права доступа     
-----------+----------+-----------+------------------+-------------+-------------+--------+-------------+-----------------------
 postgres  | postgres | UTF8      | libc             | ru_RU.UTF-8 | ru_RU.UTF-8 |        |             | 
 template0 | postgres | UTF8      | libc             | ru_RU.UTF-8 | ru_RU.UTF-8 |        |             | =c/postgres          +
           |          |           |                  |             |             |        |             | postgres=CTc/postgres
 template1 | postgres | UTF8      | libc             | ru_RU.UTF-8 | ru_RU.UTF-8 |        |             | =c/postgres          +
           |          |           |                  |             |             |        |             | postgres=CTc/postgres
(3 строки)

# список табличных пространств
# столбец "Расположение" показывает путь к данным ТП, если этот путь отличается от базового каталога данных
postgres=# \db             
     Список табличных пространств
    Имя     | Владелец | Расположение 
------------+----------+--------------
 pg_default | postgres | 
 pg_global  | postgres | 
(2 строки)

# базовый каталог данных
postgres=# show data_directory;
     data_directory     
------------------------
 /var/lib/pgsql/18/data
(1 строка)


# выход
postgres-# \q
#---------------------------------------------------------------------------------------------------

Табличные пространства

Физическая структура табличного пространства

/path/to/my_space/ 
    ├── 16384/  <-- OID конкретной базы данных (например, mydb)
    │   ├── 12345   <-- Файл данных сегмента 1 (1 ГБ)
    │   ├── 12345.1 <-- Файл данных сегмента 2 (1 ГБ)
    │   └── 12345_init <-- Файл инициализации
    └── 16385/  <-- OID другой базы данных
        └── ... 

Важные особенности

  • в одном табличном пространстве может располагаться несколько баз данных
  • одна база данных может располагаться в нескольких табличных пространствах
  • объекты (таблицы, индексы, ...) состоят из 3-х форков MAIN, VM, FSM (форк это логическое понятие)
  • MAIN форк - файлы сегментов (<oid>_vm, <oid>_vm.1, ...) содержат кортежи данных или данные индекса
  • VM (Visibility Map) форк, файлы сегментов (<oid>_vm, <oid>_vm.1, ...) содержат метаданные видимости строк на страницах данных
  • FSM (Free Space Map) форк, файлы сегментов (<oid>_fsm, <oid>_fsm.1, ...) содержат метаданные о свободном месте на каждой странице данных MAIN форка

Postgres Pro Enterprise

Основные модули и функции, уникальные для редакции Postgres Pro Enterprise

  • CFS (Compressed File System) - встроенный механизм постраничного сжатия данных для экономии дискового пространства и снижения операций ввода-вывода
  • 64-разрядный счетчик транзакций - устраняет проблему переполнения 32-разрядного счетчика транзакций (wraparound), присущую стандартному PostgreSQL
  • BiHA (Built-in High Availability) - встроенный высокодоступный отказоустойчивый кластер (multi-master) с быстрым временем переключения (failover)
  • AQO (Adaptive Query Optimizer) - расширение для адаптивной оптимизации планов запросов на основе машинного обучения
  • Усовершенствованный диагностический профайлер - инструмент для более глубокого анализа и приоритизации ресурсов
  • Автономные транзакции - поддержка автономных транзакций для определенных сценариев
  • Улучшенное секционирование таблиц - оптимизация работы с большим количеством партиций (более 10 000)
  • Уменьшенный размер B-tree индексов - оптимизация хранения дублирующихся ключей
  • Proxima - пуллер соединений и прокси-сервер, оптимизированный для работы с кластером
  • Автоматическое восстановление страниц - механизм автоматического исправления поврежденных страниц данных при репликации
  • pgpro_pwr (Postgres Pro Workload Reporter) - модуль для формирования отчетов о производительности и загрузке системы, аналогичный Oracle AWR

Лицензирование Postgres Pro Enterprise осуществляется за ядра процессора, все эти функции и модули включены в стоимость лицензии