Infrastructure Architecture in a Box: Sharepoint 2010 - Search Service Scale Out

Olá pessoal, tudo bem?

Vamos continuar com a série Infrastructure Architecture in a Box” sobre o beta do Sharepoint 2010. Durante os últimos posts nos falamos sobre vários assuntos que são considerados importantes no contexto da arquitetura de infraestrutura. As novas capacidades em conjunto com as melhorias oferecem uma oportunidade de criar arquiteturas customizadas para providenciar valores estratégicos para as empresa. Desta vez nos vamos falar sobre “Search”.

Vocês tem a opção entre três produtos que suportam varias funcionalidades em comum, mas com poder de escalabilidade e customização diferenciada. Seguintes produtos da linha Sharepoint 2010 que oferecem a capacidade de pesquisa:

  • Search Server 2010 Express (Entry Level),
  • Sharepoint Server 2010 (Infrastructure)
  • Fast Search Server 2010 for Sharepoint (High-End)

Algumas fatos importantes:

  • Sem limitação de 50 milhões de itens ;)
  • Cross-farm search service (Comaprtilhar Servicos entre Farms)
  • Crawling Service (Vários indexadores podem ser usados simultaneamente para rastrear conteúdo diferente durante cada ciclo de rastreamento)
  • Query Partitioning (Cada partição de indice pode conter até ~ 10 milhões de itens e pode também ser "clonada" com várias instâncias)
  • Multiplos Banco de Dados (Property, Crawling, Admin)

Vamos analisar as diferenças entre os produtos.                  

    Capacidades    

image

https://www.microsoft.com/downloads/details.aspx?FamilyID=D7C0091E-5766-496D-A5FE-94BEA52C4B15&displaylang=en

Repositorios

image

https://www.microsoft.com/downloads/details.aspx?FamilyID=D7C0091E-5766-496D-A5FE-94BEA52C4B15&displaylang=en 

Uma das grandes diferenças entre a versão Sharepoint 2007 e Sharepoint 2010 é a mudança do paradigma de SSP’s, para a arquitetura de “Service Applications” (Post sobre Service Applications).

O serviço responsável de providenciar a capacidade der pesquisa é o “Search Service Application” que conte quatro componentes básicos que são:

  1. Administration Component
  2. Query Component
  3. Crawl Component
  4. Databases:
    • Property Database
    • Crawl Database
    • Admin Database

Importante mencionar que um dos grandes benefícios da nova arquitetura de Service Application é a possibilidade de fornecer o serviço independente da fronteira de “Farms”. O serviço SSA (Search Service Application), é um cross farm service que pode ser consumido entre varias “Farms”. Isto oferece a possibilidade de criar uma “Farm” centralizada, que fornece o serviço de pesquisa para a organização inteira.

 Escalabilidade

Com a componentização dos serviços de pesquisa (4 Componentes Básicos), Sharepoint 2010 elimina as limitações de escalabilidade das versões anteriores. Todos componentes oferecem escalabilidade horizontal com redundância. Vamos analisar como definir uma arquitetura adequada com escalabilidade horizontal e redundância.

Ambiente Pequeno ( Para cerca de 10 milhões itens)

Arquitetura

Single índice com uma partição unica (Total) com replicação (Mirroring) A1 = A1. A partição é espelhada entre os servidores para garantir redundância. Em caso de fala de um componente de pesquisa o algoritmo interno garante o “FallBack” para a partição espelhada.

  • Servidor compartilhado entre o componente Web e pesquisa
  • Única partição de índice com espelhamento

Escalabilidade

O crescimento é garantido com a componentização dos serviços. Todos componentes podem escalar, dependendo da necessidade, horizontal ou vertical. Todas as requisições de clientes são distribuídas para todas os servidores de pesquisa e consolidados para uma única resposta.

  • Múltiplos servidores de pesquisa (Query Server)

Redundância

Redundância do serviço e garantido em este cenário via a replicação da partição entre os “Query Servers”. Em caso de falha a partição replicada pode fornecer o serviço de pesquisa.

  • Única partição de índices espelhada entre dois servidores
  • Componentes de query redundantes

 

Ambiente Pequeno ( Para cerca de 20 milhões itens)

Arquitetura

Single índice com uma partição unica (Total) com replicação (Mirroring) A1 = A1. A partição é espelhada entre os servidores para garantir redundância. Em caso de fala de um componente de pesquisa o algoritmo interno garante o “FallBack” para a partição espelhada.

  • Servidor compartilhado entre o componente Web e pesquisa
  • Multiplas partiçoes de índice com espelhamento

Escalabilidade

O crescimento é garantido com a componentização dos serviços. Todos componentes podem escalar, dependendo da necessidade, horizontal ou vertical. Todas as requisições de clientes são distribuídas para todas os servidores de pesquisa e consolidados para uma única resposta.

  • Múltiplos servidores de pesquisa (Query Server)

Redundância

Redundância do serviço e garantido em este cenário via a replicação da partição entre os “Query Servers”. Em caso de falha a partição replicada pode fornecer o serviço de pesquisa.

  • Multiplos particoes de índices espelhadas entre dois servidores
  • Componentes de query redundante
  • Componente de “Crawl” redundante

 

Ambiente Corporativo Grande ( Para cerca de 40 milhões itens)  

Arquitetura

Single índice (Total) com múltiplas partições com replicação per partição. A partição é espelhada entre os servidores para garantir redundância. Em caso de fala de um componente de pesquisa o algoritmo interno garante o “FallBack” para a partição espelhada.

  • Servidor compartilhado entre o componente Web e pesquisa
  • Multiplas partiçoes de índice com espelhamento
  • Múltiplos servidores de bancos de dados  (Crawl, Property)

Escalabilidade

O crescimento é garantido com a componentização dos serviços. Todos componentes podem escalar, dependendo da necessidade, horizontal ou vertical. Todas as requisições de clientes são distribuídas para todos os servidores de pesquisa e consolidados para uma única resposta.

  • Múltiplos servidores de pesquisa
  • Múltiplos servidores de “Crawling”
  • Múltiplos servidores de bancos de dados
    • Crawl DB
    • Property DB

Redundância

Redundância do serviço e garantido em este cenário via a replicação da partição entre os “Query Servers”. Em caso de falha a partição replicada pode fornecer o serviço de pesquisa.

  • Multiplos particoes de índices espelhadas entre dois servidores
  • Componentes de query redundante
  • Componente de “Crawl” redundante
  • Multiplos banco de dados em cluster

Virtualização

Virtualização é uma forma eficaz para reduzir o custo total da solução, consolidando vários servidores em um único host físico. Utilizando tecnologias como o Hyper-V ™ para Windows Server 2008 e System Center Virtual Machine Manager, você pode virtualizar toda ou parte do ambiente de pesquisa do SharePoint Server 2010 com a consolidação de servidores que executam uma função específica, tais como servidores de consulta ou servidores de rastreamento.
A virtualização oferece benefícios nas áreas de custos de manutenção de hardware e servidor, espaço no centro de dados, capacidade de gerenciamento, facilidade de implantação e capacidade de expansão rápida.

Espero que vocês gostarem e nos vamos continuar falar sobre o Beta 2 do Sharepoint 2010, um grande produto !

Abraços Markus

Technorati Tags: Sharepoint 2010,Infraestrutura,Insfrastructure Architecture in a Box