Como pesquisar PDFs e extrair páginas correspondentes com automator? -- pdf campo com automator camp apple Relacionado O problema

How to search PDFs and extract matching pages with Automator?


0
vote

problema

português

Eu estou tentando fazer um fluxo de trabalho automático que vai me dar:

    .
  1. Especifique uma pasta para executar as ações em
  2. Pesquisar todos os arquivos PDF nessa pasta para uma determinada palavra (nome do meu cliente)
  3. Crie um novo arquivo PDF com apenas essas páginas em que o nome do meu cliente aparece
  4. Salve esse arquivo na área de trabalho

Digite a descrição da imagem aqui

Até agora, posso fazer as etapas 1 e 2. Mas existe alguma maneira de ver quais páginas as partidas estavam ativadas ou para criar um novo PDF para as páginas correspondentes?

english

I am trying to make an Automator workflow that will alllow me to:

  1. Specify a folder to run the actions on
  2. Search all PDF files in that folder for a certain word (my client's name)
  3. Create a new PDF file with just those pages on which my client's name appears
  4. Save that file on the desktop

enter image description here

Thus far, I can do steps 1 and 2. But is there any way to see what pages the matches were on or to create a new PDF for the matching pages?

     

Lista de respostas

1
 
vote

Eu percebo que isso é um ano depois que você fez a pergunta, mas gostei do desafio. Então, em resumo, é assim que eu conseguisse isso ...

  • para cada PDF na pasta, convertê-lo no texto.
  • Use um comando perl para pesquisar os arquivos de texto para palavra-chave e retornar o (s) número (s) de página.
  • use ferramenta de linha de comando para extrair página (s) de PDF.
  • Mesclar páginas extraídas.

Você pode fazer a primeira parte facilmente com o AppleScript / Automator.

O comando perl para obter os números de página é:

perl -ne 'print "$1$2" if /blah/ .. /--- Page (d+) ---( )/'

A ferramenta de comando para usar para extrair páginas do arquivo PDF pode ser encontrada em Users.skynet.be/tools/

Finalmente para mesclar as páginas únicas pode ser feito com o Automator ou as ferramentas acima também.

Espero que isso ajude.

 

I realise this is a year after you asked the question but I liked the challenge. So, in summary this is how I would accomplish this...

  • For every PDF in folder, convert it to Text.
  • Use a perl command to search the text files for keyword and return the page number(s).
  • Use command line tool to extract page(s) from PDF.
  • Merge extracted pages.

You can do the first part easily enough with applescript/automator.

The perl command to get the page numbers is:

perl -ne 'print "$1$2" if /blah/ .. /--- Page (\d+) ---(\n)/'

The command tool to use to extract pages from PDF file can be found at users.skynet.be/tools/

Finally to merge the single pages can be done with automator or the above tools as well.

Hope this helps.

 
 

Perguntas relacionadas

1  Como executar o script do shell no lançamento do aplicativo?  ( How to run shell script upon application launch ) 
Não tenho certeza se isso pertence aqui ou no superusuário, mas é o Mac específico, então eu vou com aqui. Eu escrevi um script Ruby que edita o arquivo de ...

0  Como pesquisar PDFs e extrair páginas correspondentes com automator?  ( How to search pdfs and extract matching pages with automator ) 
Eu estou tentando fazer um fluxo de trabalho automático que vai me dar: . Especifique uma pasta para executar as ações em Pesquisar todos os arquivos PDF ...

1  Em um serviço, como obter um URL de rico texto?  ( In a service how to get a url from rich text ) 
Estou interessado em fazer um serviço (usando automator, se possível) que me permita executar uma ação em um URL. Se o URL existir como texto simples, isso ...

0  Convertendo Ação Automático no AppleScript para Bash Script  ( Converting automator action in applescript to bash script ) 
Acabei de escrever um aplicativo automático usando o AppleScript (junto com algumas linhas de bash) para iniciar o FTP com um único clique. No entanto, corre ...

6  MacOS Catalina causando "Encontrar :.: Operação não permitido" erros  ( Macos catalina causing find operation not permitted errors ) 
Eu tenho um fluxo de trabalho de automação que uso como uma ação rápida. É preciso um item localizador e chama um script de shell com ele. Parte do script de ...

1  Digitando automaticamente uma senha no terminal  ( Automatically typing a password into terminal ) 
Eu quero ser capaz de alterar a senha de uma imagem de disco, mas totalmente automatizada. Existe uma maneira de inserir uma string como uma senha em vez de t...

4  Remover serviços de menus de contexto (mas deixá-los no menu de serviços do aplicativo)  ( Remove services from context menus but leave them in the apps services menu ) 
Eu criei alguns serviços com automator e parece que o OS X adiciona automaticamente isso ao menu de contexto de arquivos / pastas que eles se aplicam. É possí...

2  Automator Combine PDF Aplicativo  ( Automator combine pdf application ) 
Eu criei quase uma aplicação automática exata como aqueles que postaram antes de mim e vai da seguinte forma; 1) Obter itens do Finder selecionado 2) Comb...

3  Usando Automator ou AppleScript para criptografar / descriptografar com OpenSSL  ( Using automator or applescript to encrypt decrypt with openssl ) 
Eu gostaria de saber como usar o Automator ou o AppleScript para criar uma gota que comprima / descompactar (tar.gz) e criptografar / descriptografar com arqu...

3  Possível automatizar a entrada de classificações de estrelas e play contagens para música idêntica / duplicada no iTunes?  ( Possible to automate entering star ratings and play counts for identical duplica ) 
Estou no processo de substituição de minha baixa qualidade e lt; 192 kpbs mp3s em arquivos MP3 ou ALAC de 320 KPBS no iTunes. Agora, minha rotina é importar...




© 2022 pergunte.org All Rights Reserved. Casa de perguntas e respostas todos os direitos reservados


Licensed under cc by-sa 3.0 with attribution required.