Operadores booleanos e de proximidade
Caracteres curinga
Consultas de texto livre
Consultas vetoriais de espaço
Consultas de valor de propriedade
Exemplos de consulta
Lista de nomes de propriedade
Você pode procurar qualquer palavra ou frase em um site da Web: basta digitar a palavra ou frase em um formulário de consulta e clicar no botão para executar a consulta (por exemplo, o botão 'Executar a consulta', no exemplo de formulário de consulta). As pesquisas produzem uma lista dos arquivos que contêm a palavra ou a frase, independentemente de onde apareçam no texto.
Esta lista indica as regras para formatação de consultas:
Diversas palavras consecutivas são tratadas como uma frase; elas devem aparecer na mesma ordem dentro do documento que está sendo pesquisado.
As consultas não diferenciam maiúsculas/minúsculas; portanto, você pode digitar sua consulta com letras maiúsculas ou minúsculas, indiferentemente.
Você pode procurar qualquer palavra, exceto aquelas da lista de exceções (para a língua inglesa, isto inclui a, an, and, as e outras palavras auxiliares), que são ignoradas durante uma pesquisa.
Palavras que constem da lista de exceções são tratadas como espaços reservados nas consultas de frases e de proximidade. Por exemplo, se você procurou por Word for Windows, o resultado poderia dar-lhe Word for Windows e Word and Windows, porque for é uma palavra de ruído e aparece na lista de exceções.
Sinais de pontuação como ponto (.), dois-pontos (:), ponto-e-vírgula (;) e vírgula (,) são ignorados durante uma pesquisa.
Para utilizar caracteres tratados especialmente como &, |, ^, #, @, $, (, ), em uma consulta, coloque sua consulta entre aspas ().
Para procurar uma palavra ou frase que contenha aspas, coloque a frase inteira entre aspas e então duplique as aspas ao redor da palavra ou palavras que você quer circundar. Por exemplo, World-Wide Web ou Web procura por World-Wide Web ou Web.
Você pode utilizar Operadores booleanos (AND, OR e NOT) e o operador de proximidade (NEAR) para especificar dados adicionais de pesquisa.
O curinga (*) pode buscar palavras com um determinado começo. A consulta esc* busca termos como ESC, escapar, etc.
Consultas de texto livre podem ser especificadas sem considerar a sintaxe de consulta.
Podem ser especificadas consultas vetoriais de espaço.
Podem ser emitidas consultas de valor de propriedade Activex (OLE) e atributo de arquivo.
Operadores booleanos e de proximidade podem criar uma consulta mais precisa.
Para procurar | Exemplo | Resultado |
---|---|---|
Ambos os termos na mesma página | acesso and básico Ou acesso & básico | Páginas com ambas as palavras acesso e básico |
Qualquer um dos termos em uma página | cgi or isapi Ou cgi | isapi | Páginas com pelo menos uma das palavras cgi ou isapi |
O primeiro termo sem o segundo termo | acesso and not básico Ou acesso & ! básico | Páginas com a palavra acesso mas não a palavra básico |
Páginas que não tenham determinado valor de propriedade | not @size = 100 Ou ! @size = 100 | Páginas que não tenham 100 bytes |
Ambos os termos na mesma página, bem próximos | excel near projeto Ou excel ~ projeto | Páginas com a palavra excel perto da palavra projeto |
Dicas:
Você pode adicionar parênteses para aninhar expressões dentro de uma consulta. As expressões entre parênteses são avaliadas antes do resto da consulta.
Utilize aspas () para indicar que a palavra-chave de um operador booleano ou NEAR deve ser ignorada em sua consulta. Por exemplo, Abbott e Costello vai procurar páginas que contenham esta frase, e não páginas que contenham a expressão booleana. Além de ser um operador, a palavra and é uma palavra de ruído em inglês.
O operador NEAR é semelhante ao operador AND, porque NEAR retorna um acerto se ambas as palavras procuradas estiverem na mesma página. Contudo, o operador NEAR difere de AND porque a ordem de precedência associada a ele depende da proximidade das palavras. Isto é, a classificação de uma página com palavras procuradas que estejam bem próximas é maior ou igual à de uma página onde as palavras estejam mais separadas. Se houver mais de 50 palavras de distância entre as palavras procuradas, elas não são consideradas próximas o suficiente e a página recebe uma ordem de precedência zero.
Em consultas de conteúdo, o operador NOT só pode ser utilizado depois de um operador AND; ele pode ser utilizado apenas para excluir páginas que atendam a uma restrição prévia de conteúdo. Para consultas de valor de propriedade, o operador NOT pode ser usado separadamente de um operador AND.
O operador AND tem precedência maior do que OR. Por exemplo, as três primeiras consultas abaixo são iguais, mas a quarta não é:
a AND b OR c
c OR a AND b
c OR (a AND b)
(c OR a) AND b
Observação Os símbolos (&, |, !, ~) e as palavras-chave em inglês AND, OR, NOT e NEAR funcionam da mesma forma em todos os idiomas suportados pelo Index Server. Palavras-chave no idioma local estão, também, disponíveis quando o navegador local está configurado para um dos seis seguintes idiomas:
Idioma | Palavras-chave |
---|---|
Alemâo | UND, ODER, NICHT, NAH |
Francês | ET, OU, SANS, PRES |
Espanhol | Y, O, NO, CERCA |
Holandês | EN, OF, NIET, NABIJ |
Sueco | OCH, ELLER, INTE, NÄRA |
Italiano | E, O, NO, VICINO |
Para procurar | Exemplo | Resultado |
---|---|---|
Arquivos que contenham determinado texto livre | $contents como posso
imprimir no Microsoft
Excel? | Páginas que mencionem imprimir e Microsoft Excel. |
O mecanismo de consulta suporta consultas vetoriais de espaço. Consultas vetoriais retornam páginas que contenham uma lista de palavras e frases. A ordem de precedência de cada página indica em que grau a página atendeu a consulta.
Para procurar | Exemplo | Resultado |
---|---|---|
Páginas que contenham determinadas palavras | luz, lâmpada | Arquivos com palavras que coincidam da melhor maneira com as palavras que estão sendo procuradas |
Páginas que contenham começos, palavras e frases valorados | invent*, luz[50],
lâmpada[10], "luz da
lâmpada"[400] | Arquivos que contenham palavras com o começo invent, as palavras luz, lâmpada e a frase luz da lâmpada (os termos são valorados) |
As consultas de valor de propriedade podem ser utilizadas para encontrar arquivos cujos valores de propriedade atendam a determinados critérios. As propriedades sobre as quais você pode efetuar consultas incluem dados básicos dos arquivos - como nome e tamanho do arquivo e as propriedades ActiveX, inclusive o resumo do documento (abstrato), que é armazenado em arquivos criados por aplicativos que reconhecem o ActiveX.
Há dois tipos de consultas de propriedade:
Consultas relacionais de propriedade consistem em um caractere em (@), um nome de propriedade, um operador relacional e um valor de propriedade. Por exemplo, para encontrar todos os arquivos maiores do que um milhão de bytes, emita a consulta @size > 1000000.
Consultas de propriedade de expressão regular consistem em um sinal de número (#), um nome de propriedade e uma expressão regular para o valor de propriedade. Por exemplo, para encontrar todos os arquivos de vídeo (.avi), emita a consulta #filename *.avi. As expressões regulares nunca irão coincidir com as propriedades especiais conteúdo (#contents) e tudo (#all). Também pode haver propriedades adicionais de formatos específicos que não podem ser buscadas (por exemplo, #HtmlHRef para páginas HTML).
Se nenhum nome de propriedade for especificado, é assumido @contents.
As propriedades disponíveis para todos os arquivos incluem:
Nome da propriedade | Descrição |
---|---|
All | Busca qualquer propriedade que coincida |
Contents | Palavras e frases no arquivo e propriedades de texto |
Filename | Nome do arquivo |
Size | Tamanho do arquivo |
Write | Última data em que o arquivo foi alterado |
Para obter uma lista completa dos nomes de propriedade, consulte a Lista de nomes de propriedade, mais adiante nesta página.
Os operadores relacionais são utilizados em consultas relacionais de propriedade.
Para procurar | Exemplo | Resultado |
---|---|---|
Valores de propriedade em relação a um valor fixo | @size < 100 | Arquivos cujo tamanho coincida com a consulta |
Valores de propriedade com todos os bits de um conjunto ligados | @attrib ^a 0x820 | Arquivos comprimidos com o bit de arquivo ligado |
Valores de propriedade com alguns bits de um conjunto ligados | @attrib ^s 0x20 | Arquivos com o bit de arquivo ligado |
Para procurar | Exemplo | Resultado |
---|---|---|
Um valor específico | @DocAuthor = Pedro
Antunes | Arquivos criados por Pedro Antunes |
Valores que iniciem com determinado começo | #DocAuthor Milton* | Arquivos cuja propriedade de autor comece com Milton |
Arquivos com qualquer extensão, de um dado conjunto de extensões | #filename
*.|(exe|,dll|,sys|) | Arquivos com extensão .exe, .dll ou .sys |
Arquivos alterados depois de certa data | @write > 96/2/14 10:00:00 | Arquivo alterados depois de 14 de fevereiro de 1996 às 10:00 horas GMT |
Arquivos alterados depois de uma data relativa | @write > -1d2h | Arquivos alterados nas últimas 26 horas |
Vetores que coincidam com um vetor | @vectorprop = { 10, 15,
20 } | Documentos ActiveX com um valor de vectorprop igual a { 10, 15, 20 } |
Vetores nos quais todos os valores atendam a determinado critério | @vectorprop >^a 15 | Documentos ActiveX com um valor de vectorprop em que todos os valores de vetor sejam maiores do que 15 |
Vetores nos quais pelo menos um valor atenda a determinado critério | @vectorprop =^s 15 | Documentos ActiveX com um valor de vectorprop em que ao menos um valor seja 15 |
Assegure-se de utilizar o caractere # antes do nome de propriedade, quando estiver utilizando uma expressão regular em um valor de propriedade, e, em outros casos, o caractere em (@). O operador relacional igual (=) é assumido para as consultas de expressão regular.
Nome do arquivo (#filename) é a única propriedade que suporta expressões regulares com curingas à esquerda do texto. Este é o único caso em que os caracteres à esquerda são eficientes.
Valores de data e hora têm o formato yyyy/mm/dd hh:mm:ss, onde y corresponde a a (para ano). Os dois primeiros caracteres do ano e o horário completo podem ser omitidos. Datas e horas utilizam o formato GMT (Hora de Greenwich).
Datas e horas relativos ao momento atual pode ser expressos com um caractere menos (-), seguido por zero ou por mais pares de unidade inteira ou unidade de tempo. As unidades de tempo são expressas como: (y) para anos, (m) para meses, (w) para semanas, (d) para dias, (h) para horas, (n) para minutos e (s) para segundos.
Valores de moeda têm o formato x.y, onde x é a parte inteira do valor e y é a parte decimal. Não há suposição sobre as unidades.
Os valores booleanos são (t) ou (true) para TRUE e (f) ou (false) para FALSE.
Os vetores (VT_VECTOR) são expressos como uma abertura de chaves ({) seguida por uma lista de valores separados por vírgulas e, por último, um fechamento de chaves (}).
Expressões de valor único, que sejam comparadas com vetores, são expressas como um operador relacional e, então, um (^a) para all ou um (^s) para some of.
Valores numéricos podem ser decimais ou hexadecimais (sendo estes precedidos por 0x).
A propriedade contents não aceita operadores relacionais. Se um operador relacional for especificado, nenhum resultado será encontrado. Por exemplo, @contents Microsoft encontrará documentos contendo Microsoft, mas @contents=Microsoft não encontrará nada.
Expressões regulares em consultas de propriedade são definidas como se segue:
Qualquer caractere, exceto asterisco (*), ponto (.), ponto-de-interrogação (?) e barra vertical (|), tem como padrão coincidir apenas com ele próprio.
Expressões regulares podem estar entre aspas () e devem estar entre aspas sempre que contiverem um espaço ( ) ou fechamento de parênteses ()).
Os caracteres asterisco (*), ponto (.) e ponto-de-interrogação (?) comportam-se como no Windows; coincidem - respectivamente - com qualquer número de caracteres, com ponto ou fim de uma seqüência, e com um caractere qualquer.
O caractere | é um caractere de escape. Depois de |, os caracteres a seguir têm um significado especial:
Qualquer outro caractere, inclusive |, coincide com ele próprio.
Entre colchetes ([]), os seguintes caracteres têm significado especial:
Qualquer outra coisa coincide consigo mesma (ou começa ou termina um âmbito em si mesma).
Entre chaves ({}), aplica-se a seguinte sintaxe:
Para procurar por asterisco (*), ponto (.) ou ponto-de-interrogação (?), coloque-os entre colchetes (por exemplo, |[*]exemplo irá procurar *exemplo).
Exemplo | Resultado |
---|---|
@size > 1000000 | Páginas com mais de um milhão de bytes |
@write > 95/12/23 | Páginas alteradas depois da data indicada |
Uma laranjeira | Páginas com a frase uma laranjeira |
"uma laranjeira" | Conforme acima |
@contents uma laranjeira | Conforme acima |
Microsoft e @size > 1000000 | Páginas com a palavra Microsoft e que tenham mais de um milhão de bytes |
"microsoft e @size >
1000000" | Páginas que contenham a frase especificada, literalmente (não é o mesmo que o exemplo anterior) |
#filename *.avi | Arquivos de vídeo (o começo # é utilizado porque a consulta contém uma expressão regular) |
@attrib ^s 32 | Páginas em que esteja ligado o bit de atributo de arquivo |
@docauthor = João da Silva | Páginas do autor especificado |
$contents por que o céu é
azul? | Páginas que correspondam à consulta especificada |
@size < 100 & #filename
*.gif | Arquivos GIF (Graphics Interchange Format) com tamanho menor do que 100 bytes |
Estas propriedades estão sempre disponíveis para consultas. Propriedades adicionais também podem estar disponíveis, dependendo da configuração do servidor Web.
Nome amigável | Tipo de dado | Propriedade |
---|---|---|
Access | DBTYPE_DATE | A última vez em que o arquivo foi acessado. |
All | (não aplicável) | Pesquisa todas as propriedades de uma seqüência. Pode ser consultado, mas não recuperado. |
AllocSize | DBTYPE_I8 | Tamanho da alocação em disco para o arquivo. |
Attrib | DBTYPE_UI4 | Atributos do arquivo. Documentados no Win32 SDK. |
ClassId | DBTYPE_GUID | Identificador da classe do objeto, por exemplo: WordPerfect, Word etc. |
Change | DBTYPE_DATE | Última vez em que o arquivo foi alterado (inclui alterações aos atributos). |
DBTYPE_WSTR | DBTYPE_BYREF | Caracterização, ou abstrato, do documento. Computada pelo Index Server. | |
Contents | (não aplicável) | Conteúdo principal do arquivo. Pode ser consultado, mas não recuperado. |
Create | DBTYPE_DATE | Data e hora em que o arquivo foi criado. |
DocAppName | DBTYPE_STR | DBTYPE_BYREF | Nome do aplicativo que criou o arquivo. |
DocAuthor | DBTYPE_STR | DBTYPE_BYREF | Autor do documento. |
DocCategory | DBTYPE_STR | Tipo do documento, como memo, agenda ou relatório. |
DocCharCount | DBTYPE_I4 | Número de caracteres no documento. |
DocComments | DBTYPE_STR | DBTYPE_BYREF | Comentários sobre o documento. |
DocCompany | DBTYPE_STR | Nome da companhia para a qual o documento foi gravado. |
DocCreatedTm | DBTYPE_DATE | Data e hora em que o documento foi criado. |
DocEditTime | DBTYPE_DATE | Tempo total gasto para editar o documento. |
DocKeywords | DBTYPE_STR | DBTYPE_BYREF | Palavras-chave do documento. |
DocLastAuthor | DBTYPE_STR | DBTYPE_BYREF | O usuário que editou o documento mais recentemente. |
DocLastPrinted | DBTYPE_DATE | Data e hora em que o documento foi impresso pela última vez.. |
DocLastSavedTm | DBTYPE_DATE | Data e hora em que o documento foi salvo pela última vez. |
DocManager | DBTYPE_STR | Nome do gerenciador do autor do documento. |
DocPageCount | DBTYPE_I4 | Número de páginas do documento. |
DocRevNumber | DBTYPE_STR | DBTYPE_BYREF | Número da versão atual do documento. |
DocSubject | DBTYPE_STR | DBTYPE_BYREF | Assunto do documento. |
DocTemplate | DBTYPE_STR | DBTYPE_BYREF | Nome do modelo para o documento. |
DocTitle | DBTYPE_STR | DBTYPE_BYREF | Título do documento. |
DocWordCount | DBTYPE_I4 | Número de palavras no documento. |
FileIndex | DBTYPE_I8 | Identificador único do arquivo. |
FileName | DBTYPE_WSTR | DBTYPE_BYREF | Nome do arquivo. |
HitCount | DBTYPE_I4 | Número de acertos (palavras que atendem a consulta) no arquivo. |
HtmlHRef | DBTYPE_WSTR | DBTYPE_BYREF | Texto de HTML HREF. Pode ser consultado, mas não recuperado. |
HtmlHeading1 | DBTYPE_WSTR | DBTYPE_BYREF | Texto do documento HTML em estilo H1. Pode ser consultado, mas não recuperado. |
HtmlHeading2 | DBTYPE_WSTR | DBTYPE_BYREF | Texto do documento HTML em estilo H2. Pode ser consultado, mas não recuperado. |
HtmlHeading3 | DBTYPE_WSTR | DBTYPE_BYREF | Texto do documento HTML em estilo H3. Pode ser consultado, mas não recuperado. |
HtmlHeading4 | DBTYPE_WSTR | DBTYPE_BYREF | Texto do documento HTML em estilo H4. Pode ser consultado, mas não recuperado. |
HtmlHeading5 | DBTYPE_WSTR | DBTYPE_BYREF | Texto do documento HTML em estilo H5. Pode ser consultado, mas não recuperado. |
HtmlHeading6 | DBTYPE_WSTR | DBTYPE_BYREF | Texto do documento HTML em estilo H6. Pode ser consultado, mas não recuperado. |
Caminho | DBTYPE_WSTR | DBTYPE_BYREF | Caminho físico completo para o arquivo, incluindo o nome do arquivo. |
Ordem de precedência | DBTYPE_I4 | Ordem de precedência da linha. Varia de 0 a 1.000. Números maiores indicam as melhores coincidências. |
RankVector | DBTYPE_I4 | DBTYPE_VECTOR | Ordens de precedência de componentes individuais de uma consulta vetorial. |
SecurityChange | DBTYPE_DATE | Última vez em que a segurança foi alterada no arquivo. |
ShortFileName | DBTYPE_WSTR | DBTYPE_BYREF | Nome resumido (8.3) do arquivo. |
Size | DBTYPE_I8 | Tamanho do arquivo, em bytes. |
USN | DBTYPE_I8 | Número seqüencial da atualização (USN, Update Sequence Number). Somente para unidades NTFS. |
VPath | DBTYPE_WSTR | DBTYPE_BYREF | Caminho virtual completo para o arquivo, incluindo o nome do arquivo. Se houver mais de um caminho possível, então é escolhido o que atende da melhor forma a consulta específica. |
WorkId | DBTYPE_I4 | Identificador interno para o arquivo. Utilizado dentro do Index Server. |
Write | DBTYPE_DATE | Última vez em que o arquivo foi gravado. |