B-TREE e HASH INDEX — Qual a diferença?

PublishedNovember 17, 2022

I am a Senior Software Architect with extensive experience in backend development, specializing in PHP frameworks such as Laravel and Hyperf. My expertise lies in software architecture and building scalable, high-performance applications with a strong focus on Developer Experience. I design and evolve modern architectures including well-structured monoliths, microservices, and event-driven systems, always striving for a balance between performance, simplicity, and cost. I have hands-on experience in high-scale environments with over 100k users, legacy modernization, cloud cost optimization, robust API design, event-driven architectures, technical debt management, and advocating best engineering practices. As a tech community enthusiast, I organize events at DevParaná and actively share knowledge to strengthen the local ecosystem.

As a dedicated professional, I thrive on collaboration and communication, fostering strong relationships with colleagues and clients alike. My adaptability allows me to navigate challenges with ease, while my problem-solving skills enable me to find innovative solutions in dynamic environments. I believe in the power of empathy and active listening, which helps me understand diverse perspectives and create inclusive spaces. My commitment to continuous learning drives me to seek growth opportunities, ensuring that I contribute effectively to any team. I am passionate about leveraging my emotional intelligence to inspire and motivate those around me.

Event-Driven Architecture
API Design
Microsserviços
Developer Experience (DX)
Clean Architecture / DDD / SOLID
Microservices Architecture
Docker
PHP (Laravel, Hyperf, Swoole)
Software Architecture
Cloud Computing
Node.js
Laravel (PHP)
Hyperf
Kubernetes
GraphQL
Swoole

Hoje em dia, a maioria dos bancos de dados relacionais utiliza índices para melhorar a performance de consultas. Esses índices podem ser de duas formas: B-tree e Hash. Neste artigo, vamos entender a diferença entre eles e quando utilizar cada um.

O que é um índice?

Um índice é uma estrutura de dados que permite a busca de um registro em um arquivo de dados. Ele é composto por uma chave e um ponteiro para o registro correspondente. A chave é um valor que identifica o registro e o ponteiro é o endereço do registro no arquivo de dados.

O que é um índice B-Tree?

O índice B-Tree funciona como uma árvore binária de busca, onde cada nó pode ter no máximo um número fixo de filhos. A árvore é balanceada, ou seja, a diferença de altura entre os filhos de um nó não pode ser maior que 1. A árvore é balanceada através de operações de rotação e redistribuição.

Exemplo de um índice B-Tree:

Exemplo de um índice B-Tree

Fonte: How Database B-Tree Indexing Works

Onde é utilizado?

O índice B-Tree é utilizado em bancos de dados relacionais, como o MySQL, PostgreSQL, Oracle, etc. Ele é utilizado para otimizar a busca de registros em tabelas.

Devido a sua estrutura, o índice B-Tree é utilizado para buscas de registros que contenham valores de chaves próximas.

Dessa forma, fica mais fácil encontrar um registro que contenha a chave 100, do que um registro que contenha a chave 1000000, por exemplo.

O que é um índice Hash?

O índice Hash funciona como uma tabela de dispersão, onde cada chave é mapeada para um valor de dispersão. O valor de dispersão é um número que indica a posição do registro no arquivo de dados.

Talvez você esteja se perguntando: “Mas como o índice Hash funciona se não é uma árvore?”. Bom, o índice Hash funciona como uma árvore, mas a árvore é virtual. Ou seja, a árvore não é armazenada em memória, mas sim o índice Hash.

Funciona assim: cada nó da árvore é um índice Hash. Cada índice Hash é um vetor de ponteiros para os registros. O índice Hash é um vetor de tamanho fixo, onde cada posição do vetor é um ponteiro para um registro. O valor de dispersão é o índice do vetor.

O Index Hash é como se fosse uma função, onde cada chave é mapeada para um valor de dispersão. Esse valor de dispersão é o índice do vetor de ponteiros.

Exemplo de um índice Hash:

Fonte: All About Indexes, Part 2: MySQL Index Structure and Performance

Onde é utilizado?

O índice Hash é utilizado em bancos de dados não relacionais, como o MongoDB, Redis, etc. Ele é utilizado para otimizar a busca de registros em tabelas, porém, também é utilizado em bancos de dados relacionais, como o MySQL, PostgreSQL, Oracle, etc.

Devido a sua estrutura, o índice Hash é utilizado para buscas de registros que contenham valores de chaves aleatórias.

Qual a diferença entre o índice B-Tree e o índice Hash?

O índice B-Tree é utilizado para buscas de registros que contenham valores de chaves próximas, enquanto o índice Hash é utilizado para buscas de registros que contenham valores de chaves aleatórias.

O índice B-Tree é uma árvore binária de busca, enquanto o índice Hash é uma tabela de dispersão.

O índice B-Tree é utilizado em bancos de dados relacionais, enquanto o índice Hash é mais utilizado em bancos de dados não relacionais.

O Index Hash fica armazenado em memória, enquanto o índice B-Tree fica armazenado em disco.

Referências

[All About Indexes, Part 2: MySQL Index Structure and Performance](https://vertabelo.com/blog/all-about-indexes-part-2-mysql-index-structure-and-performance/ "https://vertabelo.com/blog/all-about-indexes-part-2-mysql-index-structure-and-performance/")

[How Database B-Tree Indexing Works](https://dzone.com/articles/database-btree-indexing-in-sqlite "https://dzone.com/articles/database-btree-indexing-in-sqlite")

B-TREE e HASH INDEX — Qual a diferença?

Comments

More from this blog

Microservices são débitos técnicos?

Acoplamento estático e dinâmico em Microservices

Event-driven Architecture (EDA)

Algoritimo Dijkstra

Arquitetura Hexagonal e Mensageria com PHP

O que é um índice?

O que é um índice B-Tree?

Exemplo de um índice B-Tree:

Onde é utilizado?

O que é um índice Hash?

Exemplo de um índice Hash:

Onde é utilizado?

Qual a diferença entre o índice B-Tree e o índice Hash?

Referências

Command Palette

Comments

More from this blog

O que é um índice?

O que é um índice B-Tree?

Exemplo de um índice B-Tree:

Onde é utilizado?

O que é um índice Hash?

Exemplo de um índice Hash:

Onde é utilizado?

Qual a diferença entre o índice B-Tree e o índice Hash?

Referências