Разработка методов работы с графами больших размеров в облачной инфраструктуре

R& D-центр — центр исследований и разработки Т-Банка. Инсайт — важное понимание или вывод. БД — базы данных. JanusGraph, HugeGraph и networkit — платформы и библиотеки для хранения и анализа графовых структур данных. ArangoDB, Nebula, GraphScope — системы управления базами данных для работы с графами. Cassandra, Scylla, Greenplum — системы управления базами данных, оптимизированные для хранения и обработки больших объемов данных по колонкам. S3 — Simple Storage Service — облачное хранилище объектов от Amazon для хранения и доступа к данным. Gremlin, AQL, Cypher, GQL — языки запросов для графовых баз данных. OLTP — Online Transaction Processing — системы для обработки транзакционных операций в реальном времени. OLAP — Online Analytical Processing — системы для аналитической обработки больших объемов данных и построения отчетов. Data Warehouse — хранилище структурированных данных для аналитики и отчетности. Data Lakehouse — унифицированная платформа для хранения и анализа данных. Profiles Platform — платформа для управления и анализа пользовательских профилей. OLAP/OLTP-кластер — кластер, который объединяет аналитические и транзакционные базы данных. Spark — фреймворк для распределенной обработки больших данных. Cassandra — колончатая база данных для масштабируемого хранения больших объемов данных. 2-hop и 3-hop окружения — тестовые среды, где запрос проходит через два или три промежуточных сервиса. ML-модели — модели машинного обучения. DWH — Data Warehouse — централизованное хранилище данных. Jaccard Similarity, Dice-Sørensen — метрики сходства множеств. PageRank, LeaderRank, Katz — алгоритмы ранжирования графов. Louvain — алгоритм обнаружения сообществ в графах. Single Node SMP узел — сервер с одним процессором, который использует симметричную многопроцессорность для параллельной обработки задач. Spark-кластер — группа серверов, которые объединены для распределенной обработки больших данных. Airflow — платформа для автоматизации, планирования и мониторинга рабочих процессов. RPS — Requests Per Second — количество запросов в секунду. Self-service ad-hoc аналитика — возможность пользователю самостоятельно строить аналитику и отчеты без помощи разработчиков.

© 2006—2026, АО «ТБанк», официальный сайт, универсальная лицензия ЦБ РФ № 2673