img

Установка Apache Cassandra на Linux

Apache Cassandra — это популярное программное обеспечение базы данных NoSQL с открытым исходным кодом. Cassandra обеспечивает высокую доступность при обработке большого объема данных. Обычные реляционные базы данных не могут справиться с линейным масштабированием, бесшовным распределением данных и другими требованиями к большим данным так же эффективно, как Cassandra.

Ряд крупных игроков в онлайн-индустрии используют Apache Cassandra, такие как Netflix, Apple, Uber и eBay.

В этом руководстве мы расскажем как установить Apache Cassandra на Ubuntu Linux с необходимыми пакетами.


ШАГ 1: Установите пакеты, необходимые для Apache Cassandra

Прежде чем приступить к установке Cassandra в Ubuntu, убедитесь, что вы установили Java OpenJDK 8 и пакет api-transport-https.

Если у вас уже установлены эти пакеты, вы можете перейти к шагу 2 руководства.

Примечание. В качестве примеров мы использовали Ubuntu 20.04, но инструкции применимы и к другим версиям Ubuntu.

Установите Java OpenJDK

Apache Cassandra нуждается в OpenJDK 8 для работы в системе Ubuntu. Сначала обновите репозиторий пакетов:

sudo apt update

Когда процесс завершится, установите OpenJDK 8 с помощью следующей команды:

sudo apt install openjdk-8-jdk -y

Когда установка завершится, проверьте, успешно ли установлена Java, проверив версию Java:

java -version

На выходе должна быть показана версия Java.

openjdk

Вторая цифра (8) представляет версию Java.

Установите пакет apt-transport-https

Затем установите транспортный пакет APT. Вам необходимо добавить этот пакет в свою систему, чтобы разрешить доступ к репозиториям с использованием HTTPS.

Введите эту команду:

sudo apt install apt-transport-https
apt-transport-https

В приведенном выше примере выделены последние два шага процесса установки apt-transport-https.


ШАГ 2. Добавьте репозиторий Apache Cassandra и импортируйте ключ GPG

Вам нужно добавить репозиторий Apache Cassandra и получить ключ GPG перед установкой базы данных.

Введите команду ниже, чтобы добавить репозиторий Cassandra в список источников:

sudo sh -c 'echo "deb http://www.apache.org/dist/cassandra/debian 40x main" > /etc/apt/sources.list.d/cassandra.list'

Вывод возвращается к новой строке без сообщения.

Последний крупный выпуск Cassandra на момент написания этой статьи — 4.0. Вот почему мы использовали 40 в команде. Чтобы установить более старую версию, например 3.9, замените 40x на 39x.

Затем используйте команду wget, чтобы получить открытый ключ по указанному ниже URL-адресу:

wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
wget

Если вы правильно ввели команду и URL-адрес, на выходе выводится сообщение «ОК».

Примечание: обратите внимание на регистр букв в URL-адресе выше. Вам нужно ввести правильный регистр и тире в конце команды.

ШАГ 3: Установите Apache Cassandra

Теперь вы готовы установить Cassandra на Ubuntu.

Обновите список пакетов репозитория:

sudo apt update

Затем запустите команду установки:

sudo apt install Cassandra
sudo apt install Cassandra

В приведенном выше выводе показан последний раздел процедуры установки Cassandra в Ubuntu 20.04. Вывод должен выглядеть аналогично в более старых версиях Ubuntu.

Примечание. После завершения установки служба Cassandra запускается автоматически. Также в процессе создается пользователь cassandra. Этот пользователь используется для запуска службы.

Проверка установки Apache Cassandra

Наконец, чтобы убедиться, что процесс установки Cassandra завершился правильно, проверьте состояние кластера:

nodetool status
nodetool status

Буквы UN в выводе сигнализируют о том, что кластер работает.

Вы также можете проверить статус Cassandra, введя:

sudo systemctl status cassandra

Выход должен отображаться как active (running) зеленым цветом.

sudo systemctl status cassandra

Команды для запуска, остановки и перезапуска службы Cassandra

Если по какой-либо причине после установки служба показывается неактивной, вы можете запустить ее вручную.

start cassandra

Используйте следующую команду для запуска Cassandra:

sudo systemctl start cassandra

Еще раз проверьте статус услуги. Он должен измениться на активный.

Чтобы перезапустить службу, используйте команду перезапуска:

sudo systemctl restart cassandra

Чтобы остановить службу Cassandra, введите:

sudo systemctl stop cassandra

Статус отображается как неактивный после использования команды остановки.

Автоматически запускать службу Apache Cassandra при загрузке

Когда вы выключаете или перезагружаете систему, служба Cassandra становится неактивной.

Чтобы запустить Cassandra автоматически после загрузки, используйте следующую команду:

sudo systemctl enable cassandra

Теперь, если ваша система перезагрузится, служба Cassandra включается автоматически.


ШАГ 4. Настройка Apache Cassandra

Вы можете изменить настройки конфигурации Cassandra в зависимости от ваших требований. Конфигурации по умолчанию достаточно, если вы собираетесь использовать Cassandra на одной ноде. При использовании Cassandra в кластере вы можете настроить основные параметры с помощью файла cassandra.yaml.

Мы рекомендуем создать резервную копию файла cassandra.yaml, если вы собираетесь его редактировать. Для этого используйте эту команду:

sudo cp /etc/cassandra/cassandra.yaml /etc/cassandra/cassandra.yaml.backup

Мы использовали каталог /etc/cassandra в качестве места назначения для резервной копии, но вы можете изменить путь по своему усмотрению.

Переименовать кластер Apache Cassandra

Используйте текстовый редактор по вашему выбору, чтобы открыть файл cassandra.yaml (мы будем использовать nano):

sudo nano /etc/cassandra/cassandra.yaml
cassandra.yaml

Найдите строку, которая гласит cluster_name:. Имя по умолчанию — Test Cluster. Это первое изменение, которое вы хотите сделать, когда начнете работать с Cassandra.

Если вы не хотите вносить дополнительные изменения, выйдите и сохраните файл.

Добавить IP-адреса узлов Cassandra

Еще одна вещь, которую вы должны добавить в cassandra.yaml, если вы используете кластер, — это IP-адрес каждого узла.

Откройте файл конфигурации и в разделе seed _provider найдите запись seeds

seed _provider

Добавьте IP-адрес каждого узла в вашем кластере. Разделите записи, используя запятую после каждого адреса.

ШАГ 5. Протестируйте оболочку командной строки Cassandra

Программный пакет Cassandra поставляется с инструментом командной строки (CLI). Этот инструмент использует язык запросов Cassandra - CQL для связи.

Чтобы запустить новую оболочку, откройте терминал и введите:

cqlsh
cqlsh

Загружается оболочка, показывающая подключение к кластеру по умолчанию. Если вы изменили параметр cluster_name, он покажет тот, который вы определили в файле конфигурации. В приведенном выше примере показано подключение по умолчанию к локальному хосту.


Итоги

Следуя этим простым шагам, у вас должна быть работающая установка Cassandra в вашей системе Ubuntu.

Кроме того, мы показали вам, как редактировать наиболее важные параметры в файле конфигурации Cassandra. Не забудьте сделать резервную копию файла conf на всякий случай, и вы можете начать использовать программное обеспечение базы данных Cassandra.

Узнайте больше о том, как использовать Cassandra, в нашем руководстве о том, как создавать, удалять, изменять и очищать таблицы Cassandra.

Ссылка
скопирована
Получите бесплатные уроки на наших курсах
Все курсы
DevOps
Скидка 25%
DevOps-инженер с нуля
Научитесь использовать инструменты и методы DevOps для автоматизации тестирования, сборки и развертывания кода, управления инфраструктурой и ускорения процесса доставки продуктов в продакшн. Станьте желанным специалистом в IT-индустрии и претендуйте на работу с высокой заработной платой.
Получи бесплатный
вводный урок!
Пожалуйста, укажите корректный e-mail
отправили вводный урок на твой e-mail!
Получи все материалы в telegram и ускорь обучение!
img
Еще по теме:
img
Git Flow - это специальная система ветвления для Git. Она помогает команде лучше контролировать и добавлять различные версии про
img
Docker — популярная платформа виртуализации на уровне ОС. Она поставляет приложения в пакетах (контейнерах), которые, представля
img
Хуки в Git — это bash-скрипты, которые запускаются до или после команд Git, например, коммитов и пушей. Они позволяют автоматизи
img
  Nomad и Kubernetes – это две самые популярные платформы оркестровки, предназначенные для оркестровки динамических рабочих нагр
img
  Давайте узнаем о новом Ops-течении – GitOps! DevOps поспособствовал цифровизации многих компаний. Речь идет о командах разрабо
img
  Канареечное (canary) развёртывание – это метод разработки и развертывания программного обеспечения, который позволяет выпускат
ЗИМНИЕ СКИДКИ
40%
50%
60%
До конца акции: 30 дней 24 : 59 : 59