Microsoft Index Server
Notas da versão
Visite a home page do Index Server
Arquivos de exemplo
Instalando o Index Server
Suporte ao Microsoft Internet News Service
Alterações na documentação
Removendo o Index Server
Obrigado por descarregar e instalar o Microsoft® Index Server versão 1.1 para Windows NT® Server. Este arquivo contém as alterações feitas no Index Server desde sua versão beta, assim como diversos itens importantes da instalação. Estas notas são principalmente para usuários que possuem uma versão anterior do Index Server instalada em seus computadores e estão fazendo a atualização para a versão final. Todas as alterações e observações estão resumidas nesta página.
Para obter mais informações sobre o Index Server e seus recursos, consulte a home page no seguinte endereço:
http://www.microsoft.com/ntserver/search
Os arquivos de exemplo (tais como o Query.htm) foram substituídos. Se você tiver modificado quaisquer arquivos de exemplo e não os tiver movido ou renomeado, eles foram substituídos.
A instalação do Index Server vai restaurar todas as configurações de registro para seus padrões. Se você tiver modificado as configurações de registro para o Index Server, após a instalação você terá que restaurar os valores para suas preferências.
Se o Microsoft Internet News Server tiver sido instalado em um servidor juntamente com o Index Server versão 1.1, então os artigos de notícias podem ser indexados. Você pode encontrar exemplos adicionais de formulários de consulta, escritos para um servidor de notícias, na home page do Index Server.
Os caminhos virtuais produzidos pelo IIS (Internet Information Server) convertem o ponto, entre os componentes do grupo de notícias, para uma barra. Por exemplo:
Grupo de notícias | Convertido para |
---|---|
comp.os.ms-windows.advocacy | /comp/os/ms-windows/advocacy |
Observação O caminho /comp/os/ms-windows/advocacy não é um caminho virtual válido em IIS.
As propriedades abaixo estão sempre disponíveis para consultas a grupos de notícias.
Nome amigável | Tipo de dados | Propriedade |
---|---|---|
NewsGroup | DBTYPE_WSTR | DBTYPE_BYREF | Grupo de notícias para o qual o artigo foi postado. |
NewsGroups | DBTYPE_WSTR | DBTYPE_BYREF | Conjunto completo dos grupos de notícias para os quais o artigo foi postado. |
NewsSubject | DBTYPE_WSTR | DBTYPE_BYREF | Linha temática do artigo de notícias. |
NewsFrom | DBTYPE_WSTR | DBTYPE_BYREF | Autor do artigo de notícias. |
NewsMsgId | DBTYPE_WSTR | DBTYPE_BYREF | Identificação globalmente única da mensagem de artigo. |
O realçador de acertos (Webhits.exe) é um aplicativo CGI (Common Gateway Interface) que deve ser armazenado em um caminho virtual válido, com permissão Executar. Se você quiser realçar acertos em artigos de notícias, adicione raízes virtuais, cada uma começando com /$CiNews e correspondendo a uma raiz no servidor de notícias. Assegure-se de que as raízes virtuais no IIS que comecem com /$CiNews estejam com ambas as permissões Ler e Executar desligadas.
Por exemplo, se rec.sports.* estivesse sendo armazenado em C:\Sports e a raiz padrão (home) de notícias fosse C:\Inetpub\Nntproot, duas novas raízes virtuais seriam adicionadas: /$CiNews/rec/sports=D:\Sports e /$CiNews=C:\Inetpub\Nntproot. As permissões Ler e Executar não são habilitadas para estas raízes virtuais.
Ao executar o Webhits.exe, asssegure-se de colocar o caminho virtual
/$CiNews/<%
vpath%>
no arquivo .htx, na chamada ao Webhits.exe.
Observação O realçador de acertos não checa permissões Ler para raízes virtuais que comecem com /$CiNews/.
Se uma raiz virtual no servidor de notícias apontar para um compartilhamento UNC (universal naming convention), os administradores devem adicionar uma raiz virtual no IIS. A raiz virtual NNTP (Network News Transfer Protocol) deve ser precedida por /$CiNews para realçar os artigos de notícias armazenados nesse compartilhamento UNC utilizando-se Webhits.
Na configuração do servidor de notícias, assuma o seguinte:
No IIS, configure uma raiz virtual com as seguintes propriedades:
Importante Assegure-se de desligar as permissões Ler e Executar nas raízes virtuais precedidas por /$CiNews.
Esta seção detalha alterações e acréscimos à documentação existente.
Nas seções que discutem as variáveis PROOT_virtual e INDEX_virtual root, (Ativando a indexação de uma raiz virtual e Forçando a varredura de uma raiz virtual), se a raiz for uma raiz de notícias, estas variáveis são PROOT_NNTP_virtual e INDEX_NNTP_virtual root.
Você pode determinar o tipo de uma raiz virtual enquanto faz a consulta VIRTUAL_ROOTS. Observe o valor da propriedade especial StorageType-(DBTYPE_UI4) = b725f130-47ef-101a-a5f1-02608c9eebac 4. O valor 0 identifica uma raiz Web. O valor 1 identifica uma raiz de notícias.
Esta seção lista acréscimos e correções às mensagens de erro do Index Server, contidas na página Mensagens de erro.
Mensagem | Explicação |
---|---|
A conta id-do-usuário não tem privilégio de logon interativo neste computador. Você pode dar-lhe tal privilégio utilizando a ferramenta administrativa do gerenciador de usuários. | O especificado não tem permissão de logon interativo no computador que está executando o Index Server. Dê ao id-do-usuário o privilégio de logon interativo por meio do Gerenciador de usuários para domínios. |
No final de uma página de resultados, é possível que você periodicamente veja a seguinte mensagem:
Mensagem | Explicação |
---|---|
O índice está desatualizado. | Houve modificações nos arquivos desde a última vez em que o escopo de sua consulta foi indexado. Todas as vezes que arquivos em um escopo são modificados, o Index Server os reindexa automaticamente, sempre que os recursos do sistema estiverem disponíveis. Se você ver esta mensagem no final de uma página de resultados, aguarde alguns minutos e tente novamente sua consulta. |
Mensagem | Explicação |
---|---|
Há cópias demais do realçador de acertos sendo executadas. Por favor, tente mais tarde. | Há mais instâncias simultâneas do Webhits do que a quantidade máxima definida na chave de registro MaxRunningWebhits. Tente executar sua consulta mais tarde, quando o servidor estiver menos ocupado. |
O realce de acertos levou tempo demais para ser executado e foi interrompido. | Como o Webhits gastou mais tempo do que o permitido para processar um documento, o servidor cancelou o processo. O documento pode ser grande demais ou pode estar corrompido. Peça ao administrador para verificar o documento. |
Mensagem | Explicação |
---|---|
A raiz virtual <raiz> foi adicionada ao índice. | Quando uma raiz virtual é indexada, a mensagem "Mapeado para <caminho>" é adicionada ao log de eventos. |
A raiz virtual <raiz> foi removida do índice. | Quando uma raiz virtual é excluída do índice, esta mensagem é gravada no log de eventos. |
O escopo <caminho> foi adicionado ao índice. | Quando um novo escopo físico é indexado, esta mensagem é adicionada ao log de eventos. |
O escopo <caminho> foi removido do índice. | Quando um novo escopo físico é excluído do índice, esta mensagem é gravada no log de eventos. |
Observação> Quando as raízes virtuais apontam para posições abaixo uma da outra, adicionar e remover raízes virtuais pode não ter efeito sobre os escopos físicos no índice. Por exemplo, alguns sites como o www.microsoft.com são marcados, no sentido comercial da palavra, com raízes virtuais. Assim, se o usuário deseja informações sobre o Windows NT Server, ele segue o caminho http://www.microsoft.com/NTServer, embora http://www.microsoft.com/products/backoffice/ntserver também seja um caminho válido. Neste exemplo, se você tiver removido a raiz virtual mais baixa (/NTServer), mesmo assim as páginas serão indexadas, porque estão incluídas em outro caminho, http://www.microsoft.com/products/backoffice/ntserver neste exemplo.
O filtro de HTML não indexará nenhum conteúdo ou propriedade de um campo HTML, caso o arquivo HTML contenha o seguinte marcador meta:
<meta name="robots" content="noindex">
Um Webmaster pode adicionar este marcador meta para evitar seletivamente a indexação de certos arquivos HTML.
Se um arquivo HTML contiver o marcador meta que se segue, o campo de conteúdo especifica o código de idioma:
<meta name="ms.locale" content="EN">
O arquivo é filtrado pelos recursos de linguagem para aquele idioma específico (se disponível).
O campo de conteúdo neste marcador também pode especificar o local utilizando um número decimal, como 1033, que é a identificação de local para Inglês dos EUA.
Algumas propriedades de marcadores meta estão mapeadas nos conjuntos de propriedades do Microsoft® Office, para permitir aos usuários marcar páginas HTML com as mesmas propriedades no conjunto de propriedades Office. A lista de propriedades mapeadas é a seguinte:
Propriedade | Mapeada para |
---|---|
<meta name="author" content="ruth"> | A propriedade author (autor) no conjunto de propriedades das informações de resumo. |
<meta name="subject" content="word processing"> | A propriedade subject (assunto) no conjunto de propriedades das informações de resumo. |
<meta name="keywords" content="fonts, serif"> | A propriedade keyword (palavra-chave) no conjunto de propriedades das informações de resumo. |
<meta name="ms.category" content="fiction"> | A propriedade category (categoria) no conjunto de propriedades das informações de resumo do documento. |
Na seção "Parâmetros do Webhits", o parágrafo referente ao parâmetro CiQueryFile deve conter caminho virtual em vez de caminho físico. O parágrafo deve ficar como se segue:
Formato: CiQueryFile=Caminho virtual
Este parâmetro é opcional. Se ele for passado, CiQueryFile especifica o caminho virtual do arquivo .idq file que contém a seção [Names], a qual descreve as propriedades personalizadas. Você deve passar este parâmetro para todas as consultas que envolvam propriedades personalizadas. Se você tentar realçar acertos de um documento com uma consulta que tenha uma propriedade personalizada e se você não especificar o arquivo .idq adequado, será exibida a mensagem de erro "Propriedade inexistente".
Os seguintes parâmetros foram adicionados à seção "Parâmetros do Webhits":
CiBeginHilite CiEndHilite |
Formato: CiBeginHilite=BeginTags&CiEndHilite=EndTags |
Estes dois parâmetros juntos personalizam palavras realçadas no resultado de uma consulta. Se você especificar estes marcadores, o Index Server vai ignorar todos os outros parâmetros de formatação CiBold, CiHiliteColor, CiItalic etc.
Importante Você deve ajustar BeginTags e EndTags à formatação correta de HTML. Uma falha ao fazê-lo produzirá resultados imprevisíveis. Quando você especifica estes parâmetros no arquivo modelo de consulta (arquivo .htx), deve abrir e fechar os marcadores apropriadamente. Por exemplo:
Os dois parâmetros juntos no exemplo acima fazem com que as palavras realçadas apareçam no resultado da pesquisa em vermelho e itálico. |
CiHiliteType |
Formato: CiHiliteType=[Full|Summary] |
Este parâmetro é opcional. Se não for especificado, Resumo é o padrão.
Resumo O recurso resumo pode gerar pequenos excertos de um documento, em torno de palavras que atendam à especificação da consulta. |
CiLocale |
Formato: CiLocale =Local |
Este parâmetro é opcional. Se for especificado, o local indicado será utilizado para interpretar a sequência CiRestriction. A saída também será gerada utilizando esse local. Valores válidos para a sequência CiLocale estão na página "Variáveis em arquivos .idq e .htx". |
CiMaxLineLength |
Formato: CiMaxLineLength=Número |
Este parâmetro é opcional. Quando é especificado, o Webhits pré-formata o texto com os marcadores HTML <pre> e </pre>. Se o tamanho de uma linha exceder o número especificado, ela é quebrada no próximo fim de palavra. Esta opção funciona melhor quando o realce completo foi escolhido. |
CiTemplateFile |
Formato: CiTemplateFile=Caminho virtual |
Este parâmetro é opcional, mas altamente recomendado. Ele especifica o caminho virtual do arquivo modelo que gera a saída do Webhits. A extensão recomendada para um arquivo modelo do Webhits é .htw. Este arquivo modelo, como os utilizados para consultas, permite a você personalizar a saída. Ele tem uma seção de cabeçalho, uma seção de detalhe e uma seção de rodapé. O formato do arquivo modelo utilizado pelo Webhits é o mesmo do arquivo modelo utilizado para consultas, com as seguintes diferenças:
Os únicos parâmetros substituíveis permitidos são Exemplos de arquivos-modelo, para formatação de saída no Webhits, estão incluídos nos exemplos instalados como:
/Scripts/Samples/Search/Qfullhit.htw CiUrl O caminho virtual do documento que está sendo realçado substitui este parâmetro. CiRestriction O valor especificado para Webhits no parâmetro CiRestriction substitui este parâmetro. CiUserParamNúmero Onde Número pode variar de 1 a 10. O valor correspondente, especificado no parâmetro CiUserParamNúmero, substitui este parâmetro. |
CiUserParamNúmero |
Formato: CiUserParamNúmero=valor, onde valor pode ser qualquer sequência não-nula de caracteres. |
CiUserParamNúmero é qualquer parâmetro que possa ser especificado para Webhits e que possa ser substituído em CiTemplateFile. Em CiUserParamNúmero, Número pode variar de 1 a 10. Por exemplo, CiUserParam1, CiUserParam3, CiUserParam5 etc. |
Na seção Arquivos utilizados,
o texto deve ser como se segue:
O Webhits instala os seguintes arquivos:
/Scripts/Samples/Search/Webhits.exe
/Scripts/Samples/Search/Queryhit.htx
/Scripts/Samples/Search/Queryhit.idq
/Scripts/Samples/Search/QSumrhit.htw
/Scripts/Samples/Search/QFullhit.htw
/Samples/Search/Queryhit.htm
Todos os arquivos acima demonstram o realce de acertos Summary (resumo) e Full-text (completo).
Os parágrafos abaixo foram adicionados à Seção Names.
O filtro de HTML emite código de script incorporado em uma página HTML como uma propriedade de script com o GUID 31F400A0-FD07-11CF-B9BD-00AA003DB18E. O nome de propriedade do script é especificado pelo campo de linguagem do marcador do script, por exemplo:
<script language="vbscript">
Neste exemplo, o nome da propriedade é vbscript. Se nenhum campo de linguagem for especificado, então é utilizado o campo de linguagem de um marcador anterior de script na página HTML. Se também este não for especificado, então o nome da propriedade segue o padrão, que é javascript. O GUID para a propriedade do script é um parâmetro do Registro localizado em
HKEY_LOCAL_MACHINE \System \CurrentControlSet \Control\HtmlFilter \ScriptTagClsid
O exemplo a seguir mostra a você como dar nome a uma propriedade personalizada para Microsoft Office, adicionando GUID (globally unique identifier) à seção Names do arquivo .idq (Internet Data Query):
Custom_Text ( DBTYPE_STR|DBTYPE_BYREF ) = D5CDD505-2E9C-101B-9397-08002B2CF9AE "Custom_Text"
Neste exemplo, Custom_Text pode ser qualquer sequência de caracteres. O valor de Custom_Text não tem que ser o mesmo no início e no fim da linha. O do início é o nome amigável e o do fim (entre aspas) é o nome de propriedade do Microsoft Office.
Na seção "Operadores booleanos e de proximidade", a seguinte observação adiciona importantes informações sobre o operador NEAR:
Observação O operador NEAR só pode ser aplicado para palavras ou frases.
Algumas propriedades documentadas não estão disponíveis. A documentação afirma, incorretamente, que os seguintes nomes de propriedade podem ser utilizados:
DocCategory
DocCompany
DocManager
Para utilizar estas propriedades, você deve listá-las em uma seção [Names] no arquivo .idq. Para utilizá-las em uma restrição, uma especificação de classificação ou como uma coluna recuperada, você tem que adicionar as seguintes definições ao arquivo .idq:
[Names]
#Propriedades de documentos do Office que nao estao na lista padrao
DocCategory ( DBTYPE_STR ) = D5CDD502-2E9C-101B-9397-08002B2CF9AE 0x2
DocManager ( DBTYPE_STR ) = D5CDD502-2E9C-101B-9397-08002B2CF9AE 0xE
DocCompany ( DBTYPE_STR ) = D5CDD502-2E9C-101B-9397-08002B2CF9AE 0xF
Todas as chaves estão no seguinte caminho:
HKEY_LOCAL_MACHINE
\SYSTEM
\CurrentControlSet
\Control
\contentindex
Foram adicionados os seguintes parâmetros:
CiCatalogFlags REG_DWORD |
Padrão: 0
Limites: 0 - 2 |
Controla o comportamento do Index Server com base em certos sinalizadores. Atribua o valor 1 para desligar as notificações em todos os caminhos remotos UNC. Defina este sinalizador se o Index Server estiver configurado para indexar documentos em uma rede WAN (wide area network) com links lentos. Atribua o valor 2 para desligar as notificações em todos os caminhos locais. Quando um destes sinalizadores está definido, o Index Server dispara varreduras periódicas nos caminhos para os quais as notificações tiverem sido desativadas. O parâmetro de registro ForcedNetPathScanInterval controla a frequência de caminhos. |
MasterMergeCheckpointInterval REG_DWORD |
Unidade: Kilobytes
Padrão: 256 Limites: 256 - 4096 |
Especifica o intervalo depois do qual um novo índice é nivelado como produto de uma combinação principal. |
MaxRunningWebhits REG_DWORD |
Padrão: 20
Limites: 1 - 200 |
Especifica o número máximo de instâncias simultâneas do Webhits. Quando este valor é excedido, gera-se a mensagem de erro indicada a seguir e o usuário é orientado a tentar novamente mais tarde. Aumente este valor para computadores com mais memória ou mais processadores. |
MaxShadowFreeForceMerge REG_DWORD |
Unidade: Porcentagem de espaço livre em disco
Padrão: 20 Limites: 5 - 4,000,000,000 |
Especifica a porcentagem de espaço livre em disco ocupada por índices secundários em uma unidade de disco de catálogo. Se esta porcentagem exceder o valor definido para este parâmetro e se o espaço livre total em disco cair abaixo do mínimo definido em MinDiskFreeForceMerge, começará uma combinação principal. Por exemplo, se este parâmetro for definido como 500, o total de espaço livre em disco for de 10 megabytes e o total de espaço ocupado por índices secundários for de 40 megabytes, não ocorrerá nenhuma combinação principal (40*100/10 é menor do que 500). Entretanto, se o valor deste parâmetro for 300, inicia-se uma combinação principal, porque 40*100/10 é maior do que 300. |
MaxWebhitsCpuTime REG_DWORD |
Unidade: Segundos
Padrão: 30 Limites: 5 - 7200 |
Especifica o valor do tempo limite para o Webhits, em segundos de CPU. Se o Webhits não processar um documento em um tempo total estipulado, uma mensagem de erro indicará que o tempo permitido foi ultrapassado. |
As seguintes variáveis foram adicionadas como variáveis somente-leitura para os arquivos .htx.
Nome da variável | Significado |
---|---|
CiVersionMajor | A maior versão do Index Server. |
CiVersionMinor | A menor versão do Index Server. |
Para outras variáveis, consulte Variáveis somente-leitura disponíveis em arquivos .htx
na página "Variáveis em arquivos .idq e .htx".
Esta seção lhe diz como excluir o Index Server de seu computador.