lucylattes

lucyLattes

DOI

Última atualização

Motivação

O CNPq por meio do currículo Lattes agrega dados do registro da vida profissional de estudantes, professores, e pesquisadores do país, e tornando-se padrão nacional no meio científico para consulta sobre a produção científica dos referidos profissionais.

Contudo, após a criação do captcha para o acesso aos currículos Lattes, extrair dados dos currículos se tornou uma tarefa árdua, pois todas vez que pretende-se acessar um currículo, torna-se necessário passar pelo captcha. Com o intuito de auxiliar na obtenção destes dados, o lucyLattes foi desenvolvido.

Com o intuito de melhorar a extração dos dados, e reduzir a possibilidade de erros de execução, a versão v1.0.0 foi desenvolvida. As principais mudanças estão na lógica de extração dos dados, organização dos arquivos e novos relatórios.

O que faz

Extração, compilação, e organização dos dados dos currículos da plataforma Lattes em arquivos de texto, e geração de um relátório simplificado, que proporcionam agilidade para a geração de informação.

Veja algumas informações geradas:

Publicações de periódicos por ano

Notas

O lucyLattes não tem vínculo com o CNPq. Este programa computacional é fruto de um esforço (independente) realizado com o objetivo de dar suporte às rotinas de análise de dados cadastradas nos Currículos Lattes (publicamente disponíveis).

Este programa é um software livre; você pode redistribui-lo e/ou modificá-lo dentro dos termos da Licença Pública Geral GNU. Verifique o arquivo LICENSE.txt .

Este programa é distribuído na esperança que possa ser útil, mas SEM NENHUMA GARANTIA; sem uma garantia implicita de ADEQUAÇÂO a qualquer MERCADO ou APLICAÇÃO EM PARTICULAR. Verifique o arquivo LICENSE.txt .

Como usar

Inicialmente recomenda-se a leitura dos próximos tópicos (Instalação e Como executar o programa).

Requerimentos:

Instalação no Linux

Python

sudo apt-get install python3
sudo apt-get install python3-pip
sudo apt-get install python3-tk

Ambiente virtual python (virtual environments) no Linux

Para saber mais sobre ambiente virtual em Python, clique aqui https://docs.python.org/3/library/venv.html. Também fiz um post resumido sobre o assunto AQUI.

  1. Crie uma pasta (diretório) e o ambiente virtual:
 mkdir teste_venv
 
 python3 -m venv ./teste_venv
  1. Para ativar o ambiente virtual:
rt@rt-av52a:~/.virtualenvs$ source ./teste_venv/bin/activate

(teste_venv) rafatieppo@rt-av52a:~/.virtualenvs$ 
  1. Para DEsativar o ambiente virtual:
(teste_venv) rafatieppo@rt-av52a:~/.virtualenvs$ deactivate
rafatieppo@rt-av52a:~/.virtualenvs$

Pacotes Python

Para todos os sistemas operacionais (Linux, MacOS, Windows, Solaris, etc) são necesssários as mesmas bibliotecas. Para instalar as bibliotecas em ambientes Linux acesse o Terminal, ative o seu ambiente Python e instale os pacotes.

Posteriormente, com o ambiente virtual ATIVADO, instale os pacotes necessários. No arquivo requirements_lucyLattes.txt está listado os pacotes necessários. Com o pip é possível executar o comando pip install -r requirements_lucyLattes,txt , e possivelmente os pacotes serão instalados. Ou ainda, vc pode instalar um pacote por vez.

(teste_venv) rt@rt-av52a:~/.virtualenvs$ pip3 install numpy
Collecting numpy
  Cache entry deserialization failed, entry ignored
  Downloading https://files.pythonhosted.org/packages/b8/46/40729c784/numpyx86_64.whl (14.1MB)
    100% |████████████████████████████████| 14.1MB 128kB/s 
Installing collected packages: numpy
Successfully installed numpy-1.21.1
(teste_venv) rafatieppo@rt-av52a:~/.virtualenvs$

Instalação no Windows

Acesse https://python.org.br/instalacao-windows/ e instale a versão do Python 3 (versão 3.8 ou superior), basta seguir as instruções. Não esqueça de instalar o PIP.

Recomenda-se criar um ambiente virtual para instalar os pacotes e executar o lucyLattes.

Ambiente virtual python (virtual environments) no Windows

  1. Acesse o Power Shell como Administrador (botão direito) e libere a execução de Scripts. Se quiser saber mais Microsot

No Power Shell digite:

Set-ExecutionPolicy Unrestricted

pressione S ou Y.

  1. Crie uma pasta (diretório) que neste exemplo é denominada teste_venv:
C:\Users\Joao\> mkdir teste_venv
  1. Crie o ambiente virtual na pasta que foi criada:
C:\Users\Joao\> python3 -m venv ./teste_venv
  1. Ative seu ambiente virtual.
C:\Users\Joao\> \teste_venv\Scripts\activate

Pronto, agora é só instalar as bibliotecas com o pip e posteriormente executar o LucyLattes.

  1. Para desativar o ambiente virtual.
(teste_venv) C:\Users\Joao\> deactivate
C:\Users\Joao\>

Pacotes Python

Para todos os sistemas operacionais (Linux, MacOS, Windows, Solaris, etc) são necesssários as mesmas bibliotecas. Para instalar as bibliotecas em ambientes Linux acesse o Terminal, ative o seu ambiente Python e instale os pacotes.

Posteriormente, com o ambiente virtual ATIVADO, instale os pacotes necessários. No arquivo requirements_lucyLattes.txt está listado os pacotes necessários. Com o pip é possível executar o comando pip install -r requirements_lucyLattes,txt , e possivelmente os pacotes serão instalados. Ou ainda, vc pode instalar um pacote por vez.

(teste_venv) C:\Users\Joao\>  pip install numpy
Collecting numpy
  Cache entry deserialization failed, entry ignored
  Downloading https://files.pythonhosted.org/packages/b8/46/40729c784/numpyx86_64.whl (14.1MB)
    100% |████████████████████████████████| 14.1MB 128kB/s 
Installing collected packages: numpy
Successfully installed numpy-1.21.1
(teste_venv) C:\Users\Joao\>

Como executar o programa

  1. Faça o Download do arquivo .zip que contém o lucyLattes. Download aqui: https://rafatieppo.github.io/lucylattes/. Escolha a opção .zip ou .tar para fazer o download dos aquivos.

  2. Descompacte o arquivo .zip que em um diretório de sua preferência.

  3. Faça o dowload dos curriculos Lattes desejados e copie todos no diretório xml_zip. Para realizar o download dos currículos Lattes, acesse o currículo Lattes do pesquisador, e no canto superior direito clique sobre um botão XML, salve o arquivo e NÃO altere o nome e nem o formato, e NÃO DESCOMPACTE OS ARQUIVOS. O nome do arquivo é composto por 16 caracteres e a extensão .zip, e.g. 3275865819287843.zip.

  4. Pelo terminal (ou power shell), e com o ambiente virtual ATIVADO, acesse o diretório descompactado, e digite:

python3 app_lucyLattes.py

python.exe app_lucyLattes.py (ou algo similar)

  1. Se tudo ocorreu corretamente, uma interface aparecerá:

Agora selecione as opções disponíveis, clique em Gravar configurações, e execute (Run lucyLattes). Se tudo ocorreu normalmente, há um relatório disponível na pasta ./relatorio . Abra o arquivo relatorio_producao.html com o Firefox ou com o navegador da sua preferência.

Observações

**Atenção**, **Atenção**, **Atenção**.

Gostou?

Espero que o lucyLattes seja útil de alguma forma, dentro do possível estarei melhorando o script na sua funcionalidade.

Development

Files

Logs

Wed 2024-08-14 20:56:51 -04

Sun 2024-08-11 09:14:53 -04

Sat 2024-08-10 09:33:11 -04

Wed 2024-06-19 18:57:18 -04

Mon 2024-05-20 22:41:04 -04

Tue 2024-05-14 21:02:57 -04

Sat 2023-07-15 09:07:55 -04

Thu 2022-06-16 16:23:55 -04

Thu 2022-04-14 18:46:34 -04

Thu 2022-03-31 19:23:55 -04

Sat 2022-03-26 16:39:41 -04

Wed 2022-03-09 18:53:58 -04

Sun 2022-03-06 11:02:51 -04

Sun 2022-02-27 11:08:02 -04

Sat 2022-02-26 18:08:39 -04

Wed 2022-02-23 20:59:44 -04

Tue 2022-02-22 23:18:05 -04

Mon 2022-02-21 07:15:14 -04

Sat 2022-02-19 17:50:47 -04

Wed 2022-02-17 20:32:51 -04

Wed 2022-02-16 18:58:42 -04

Tue 2022-02-15 22:48:25 -04

Tue 2022-02-15 20:48:58 -04

Mon 2022-02-14 22:47:16 -04

Tue 2022-02-08 21:06:43 -04

Wed 2022-02-02 18:59:00 -04

Wed 2022-02-02 15:02:03 -04

Tue 2022-02-01 19:03:44 -04

Mon 2022-01-31 16:11:11 -04

Thu 2022-01-18 14:39:22 -04

Referências

J. P. Mena-Chalco e R. M. Cesar-Jr. scriptLattes: An open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, vol. 15, n. 4, páginas 31–39, 2009.

Rossum, G. van ( C. voor W. en I. (CWI)). (1995). Python tutorial. Python (Vol. 206). Amsterdam.

https://docs.python.org/pt-br/3/library/venv.html

https://docs.python.org/pt-br/3/tutorial/venv.html

Autor

xml schemas

<CURRICULO-VITAE
    <DADOS-GERAIS
        <RESUMO-CV
        <ENDERECO
            <ENDERECO-PROFISSIONAL
        </ENDERECO>
    </DADOS-GERAIS>

<CURRICULO-VITAE <ATUACAO-PROFISSIONAL <PARTICIPACAO-EM-PROJETO <PROJETO-DE-PESQUISA </PROJETO-DE-PESQUISA> </PARTICIPACAO-EM-PROJETO> </ATUACAO-PROFISSIONAL>


- books

<CURRICULO-VITAE </LIVRO-PUBLICADO-OU-ORGANIZADO </LIVROS-PUBLICADOS-OU-ORGANIZADOS> </LIVROS-E-CAPITULOS </PRODUCAO-BIBLIOGRAFICA>


- chapters

<CURRICULO-VITAE </CAPITULO-DE-LIVRO-PUBLICADO </CAPITULOS-DE-LIVROS-PUBLICADOS> </LIVROS-E-CAPITULOS </PRODUCAO-BIBLIOGRAFICA>


- advising finished

<CURRICULO-VITAE <ORIENTACOES-CONCLUIDAS-PARA-MESTRADO </ORIENTACOES-CONCLUIDAS-PARA-MESTRADO> <ORIENTACOES-CONCLUIDAS-PARA-DOUTORADO </ORIENTACOES-CONCLUIDAS-PARA-DOUTORADO> <ORIENTACOES-CONCLUIDAS-PARA-POS-DOUTORADO </ORIENTACOES-CONCLUIDAS-PARA-POS-DOUTORADO> <OUTRAS-ORIENTACOES-CONCLUIDAS </OUTRAS-ORIENTACOES-CONCLUIDAS> </ORIENTACOES-CONCLUIDAS </OUTRA-PRODUCAO>


- advising running

<CURRICULO-VITAE </ORIENTACOES-EM-ANDAMENTO </DADOS-COMPLEMENTARES> </CURRICULUM-VITAE>


- teaching

<CURRICULO-VITAE <ATUACAO-PROFISSIONAL <ENSINO <DISCIPLINA </DISCIPLINA> </ENSINO </ATUACAO-PROFISSIONAL>


- courses

<CURRICULO-VITAE <CURSO-DE-CURTA-DURACAO-MINISTRADO </CURSO-DE-CURTA-DURACAO-MINISTRADO>


- papers

<CURRICULO-VITAE <ARTIGOS-PUBLICADOS </ARTIGOS-PUBLICADOS>


- worksevents

<CURRICULO-VITAE ```