Skip to content

Latest commit

 

History

History
75 lines (41 loc) · 3.3 KB

README.md

File metadata and controls

75 lines (41 loc) · 3.3 KB

INFORMAÇÃO IMPORTANTE

Sempre foi um desejo que houvesse uma aplicação rodando em web, de forma que mais pessoas pudessem utilizar o FCA2. Finalmente temos uma versão beta no ar: acesse http://fabianocastello.com.br/fca2. A versão mais atualizada será a da web. Este site tem a última versão do FCA2 que foi base para a versão web. Se vc deseja contribuir para o desenvolvimento visite https://github.com/fabianocastello/fca2web.

Cheers! Fabiano julho de 2021

FCA2 FC Auto Analyser v0.9 beta (jul/21)

(no English version - sorry!)

FCA2 é um algoritmo em Python criado para análise exploratória básica de dados, que visa trazer produtividade para analistas. De forma automática, o algoritmo captura arquivos em formato csv, xls e xlsx e realiza diversas análises:

__ identificação de campos texto, campos numéricos inteiros e números decimais

__ campos texto: quantidade de registros, duplicações e de categorias, top "n" categorias (baseada em max_freq)

__ campos numéricos: quantidade de registros, registros zerados, soma total, média, desvio, máximos e mínimos, amplitude, quartis. Mesmas descrições para a base descontando os registros zerados

Desenvolvido originalmente por Fabiano Castello (www.fabianocastello.com.br), é disponibilizado sob licença GNL3.0 para toda a comunidade. FCA2 é disponibilizado em beta: use por seu próprio risco.

Contato com o desenvolvedor em fabianocastello.com.br Código mais atualizado disponível em github.com/fabianocastello/fca2 Código original registrado no DOI abaixo: https://doi.org/10.6084/m9.figshare.9902417

CONTRIBUIÇÕES

Marcus Pinto (https://github.com/marcuspinto) criou a matriz de correlações em janeiro de 2020.

DEPENDÊNCIAS

FCA2 utiliza os seguintes pacotes: os, sys, numpy, requests, pandas, datetime, time, socket, locale, seaborn, mathplot

PARÂMETROS

Parâmetros podem ser alterados no início do código. São auto-explicativos:

datain = ".\data.in" #coloque aqui seus arquivos xls ou csv dataout = ".\data.out" #onde analisador vai gravar os resultados datalog = ".\data.log" #onde o analisador vai gravar os logs do processamento datatmp = ".\data.tmp" #arquivos temporários. Será limpo após o processamento

max_freq = 10 #numeros de categorias máximas nos campos texto

COMO USAR

FCA2 rodar, atualmente, a partir de cadernos do Jupyter Notebook, com Kernel Python 3. Recomendo fortemente instalação do Anaconda (www.anaconda.com).

Para rodar o analizadort basta colocar seus arquivos formato xls, xlsx ou csv no diretório de entrada. A leitura é automática e a análise de cada arquivo é disponibilizada no diretório de saída, com o mesmo nome do arquivo.

NOTAS IMPORTANTES

__ várias pastas em arquivos xls ou xlsx: o FCA2 pegará a primeira delas para analisar.

__ vírgula "," ou ponto e vírgula ";" em arquivos CSV: o FCA2 conta o número de ocorrências de cada tipo na primeira linha do arquivo, e considera como separador o maior número de ocorrências

EM DESENVOLVIMENTO

__ versão web usando streamlit para ampliar o uso da ferramenta.

NO FUTURO

__ colocar todas as informações juntas em um PDF.

__ inserir data labels nos histogramas.

__ montar correlação entre variáveis numéricas.

__ criar uma versão compilada para ampliar o uso por pessoas que não usam python