Symantec Data Loss Prevention OCR

OCR (reconhecimento óptico de caracteres) O Reconhecimento de imagem sensível fornece a capacidade de extrair texto de imagens (documentos digitalizados, capturas de tela, imagens e assim por diante) e de PDFs, permitindo que você use regras de detecção baseadas em texto novas ou preexistentes neste conteúdo.

A extração de imagens de arquivos do Microsoft Office não é compatível.

O texto extraído então entra na cadeia de detecção e é processado de forma idêntica ao texto extraído convencionalmente. Instantâneos de incidentes para texto OCR são semelhantes àqueles para texto extraído convencionalmente: o trecho de texto é exibido, com as palavras detectadas destacadas. Os incidentes de OCR têm indicadores visuais que indicam que o texto veio do OCR e uma miniatura da imagem original.

Você pode configurar o OCR para usar vários idiomas. Para melhorar os resultados de reconhecimento, você também pode escolher um dicionário especializado (como jurídico, financeiro ou médico) para habilitar a verificação ortográfica complementar. Você também pode configurar um dicionário personalizado para lidar com nomes próprios ou outros termos específicos do seu negócio.

Embora a extração de conteúdo OCR possa ser integrada a servidores de detecção Windows e Linux, a Symantec oferece suporte à instalação do servidor OCR apenas em servidores Windows. A extração de conteúdo OCR não é compatível com os agentes do Windows, agentes macOS, os serviços de nuvem do Data Loss Prevention ou os dispositivos do Data Loss Prevention (virtuais e físicos).