Extrair dados do arquivo de texto -- and-line campo com bash camp askubuntu Relacionado O problema

extract data from text file


0
vote

problema

português

Eu tenho um arquivo de texto com saída de resultados como abaixo, só preciso de mapear o nome do FilePath e Total Number SEQS gravados a partir deste arquivo de texto, por favor sugira como eu posso obter esses dados em um arquivo de texto separado.

  Input file paths  **Mapping filepath: map_leaf_M_BAN.AC.txt** (md5: a746e6e6227fafebc545d7a7e107d55c)  Sequence read filepath: leaf-45_S51_L001.m150-p1.join.fq (md5:  8753a0afe8b89d7768e911142a1536fe)  Quality filter results  Total number of input sequences: 32992  Barcode not in mapping file: 0  Read too short after quality truncation: 682  Count of N characters exceeds limit: 0  Illumina quality digit = 0: 0  Barcode errors exceed max: 0  Result summary (after quality filtering)  Median sequence length: 273.00  LMBANAC 32310   **Total number seqs written       32310**    

Proventagem

english

I have text file having result output like below, I only need mapping filepath name and Total number seqs written from this text file, please suggest how I can get this data in separate text file.

Input file paths  **Mapping filepath: map_leaf_M_BAN.AC.txt** (md5: a746e6e6227fafebc545d7a7e107d55c)  Sequence read filepath: leaf-45_S51_L001.m150-p1.join.fq (md5:  8753a0afe8b89d7768e911142a1536fe)  Quality filter results  Total number of input sequences: 32992  Barcode not in mapping file: 0  Read too short after quality truncation: 682  Count of N characters exceeds limit: 0  Illumina quality digit = 0: 0  Barcode errors exceed max: 0  Result summary (after quality filtering)  Median sequence length: 273.00  LMBANAC 32310   **Total number seqs written       32310** 

Kind Regards

     

Lista de respostas

1
 
vote

Pipinas simples e ferramentas de texto farão o trabalho:

  walt@bat:~(0)$ grep -E -o 'Mapping filepath: [^*]+' Data.file | cut "-d " -f3 map_leaf_M_BAN.AC.txt              # Note the following regexp is fixed below - user's file had a TAB walt@bat:~(0)$ grep -E -o 'Total number seqs written +[0-9]+' Data.file | awk '{print $5}' 32310    

Como o arquivo contém um acroread: error while loading shared libraries: libxml2.so.2: cannot open shared object file: No such file or directory 0 caractere (a partir do comentário),

  acroread: error while loading shared libraries: libxml2.so.2: cannot open shared object file: No such file or directory 1   

o segundo acroread: error while loading shared libraries: libxml2.so.2: cannot open shared object file: No such file or directory 2 comando deve ser

  acroread: error while loading shared libraries: libxml2.so.2: cannot open shared object file: No such file or directory 3   

Claro, leia acroread: error while loading shared libraries: libxml2.so.2: cannot open shared object file: No such file or directory 4 .

 

Simple piplines and text tools will do the job:

walt@bat:~(0)$ grep -E -o 'Mapping filepath: [^*]+' Data.file | cut "-d " -f3 map_leaf_M_BAN.AC.txt              # Note the following regexp is fixed below - user's file had a TAB walt@bat:~(0)$ grep -E -o 'Total number seqs written +[0-9]+' Data.file | awk '{print $5}' 32310 

Since the file contains a TAB character (from the comment),

$ grep "Total number seqs written" split_library_log.txt | cat -t  Total number seqs written^I32992  Total number seqs written^I38519  

The second grep command should be

 grep -E -o 'Total number seqs written[[:space]]+[0-9]+' Data.file | awk '{print $5}'  

Of course, read man grep;man cut;man awk;man 7 regex.

 
 
         
         

Perguntas relacionadas

3  Directory Desktop não abrindo  ( Desktop directory not opening ) 
Eu sou completamente novo para o Ubuntu ou qualquer distribuição do Linux completamente. Ao usar o terminal, quando estou no diretório / home / username o c...

6  Minha função de bash é executada apenas uma vez por terminal aberta  ( My bash function runs only once per terminal opened ) 
Quando eu tento executar minha função bash, definida em .bashrc, por uma segunda vez no mesmo terminal, ela não funciona. O código é o seguinte: lspci6 ...

13  A maneira mais rápida de criar um arquivo de um terminal  ( The fastest way to create a file from a terminal ) 
Qual é a maneira mais simples de criar um arquivo usando uma linha de comando? Normalmente eu uso: touch filename Mas isso é o caminho mais simples / mais...

0  Extrair linha do arquivo  ( Extract line from file ) 
Um arquivo que preciso extrair informações da aparência 2 41620 . T G 100 PASS AC=3;AF=0.000599042;AN=5008;NS=2504;DP=1887...

9  Tirando linhas de "acesso negado"  ( Taking out access denied lines ) 
Quando eu uso find para ver todos os arquivos PDF no diretório /home , estou vendo access denied . Para eliminá-los, tentei: find /home -iname "*.pdf" ...

2  Por que meu script shell não está sendo executado? [fechado]  ( Why is my shell script not executing ) 
. fechado . Esta pergunta precisa detalhes ou clareza . Atualmente não está aceitando respostas. ...

0  Como podemos evitar inserir o caminho de cada arquivo diferente a cada vez em um script shell?  ( How can we avoid entering the path of every different file each time in a shell ) 
Eu tenho que enviar um script para slurm. Devo inserir o caminho do diretório sempre que alterar o caminho do script de envio. Por exemplo, se estou em ABCDE...

17  Por que preciso correr "/ bin / bash --login"  ( Why do i need to run bin bash login ) 
Acabei de configurar um novo servidor Ubuntu 13.10 com Ruby 2.1.1 instalado através de ABCDEFGHIJKLMNABCDEFGHIJKLMN1 . O problema é que, sempre que eu mude...

22  Bash Script não executando de Crontab [Duplicate]  ( Bash script not executing from crontab ) 
. Esta pergunta já tem respostas aqui : Por que os scripts crontab não estão funcionando? ...

3  Como definir a linguagem de resposta do SVN Info / Ligue de chamadas?  ( How to set svn info response call result language ) 
Eu localizei o Ubuntu Russo 11.10. Mas todos os meus scripts usam coisas como REMOTE_REV=`svn info $REMOTE_REPO | grep '^Revision:' | awk '{print $2}'` ...




© 2022 pergunte.org All Rights Reserved. Casa de perguntas e respostas todos os direitos reservados


Licensed under cc by-sa 3.0 with attribution required.