Procurar no blog

22 de julho de 2012

Orange Canvas


Orange é uma ferramenta open source para Data Mining com programação visual ou script em Python, repleta de funcionalidades para analise de dados para iniciantes e profissionais.

Características:

Programação Visual 
Desenhe o seu processo de análise de dados através de programação visual. Orange lembra de suas escolhas, sugere combinações mais utilizadas, e inteligentemente escolhe os canais que a comunicação deve usar entre os widgets.


Visualização
Orange é embalado com visualizações diferentes, a partir de gráficos de dispersão, gráficos de barras, as árvores, para dendrogramas, redes e Heatmaps.


Analise de interação e de dados
Propaga ações perfeitamente através de esquema analise de dados. Seleção de um subconjunto de dados em um widget pode automaticamente provocar a mudança de exibição no outro. Ao combinar diversos widgets de dados você pode criar quadro de análise de escolha.


Vasta Caixa de ferramentas
Mais de 100 Widgets. Cobertura da maioria das tarefas de análise de dados padrão. Add-ons especializados também estão disponíveis, como Bioorange para bioinformática.


Interface de Script
Com interface de script em Python, a programação de novos algoritmos e desenvolvimento de procedimentos de análise de dados complexos é muito fácil, utilização e reutilização de todo o poder encontrado em programação visual e muito mais.


Expansível
Você pode desenvolver seus próprios widgets, estender interface de script ou até mesmo criar suas próprias add-ons auto-suficientes, todos integrando com o resto do Orange, permitindo a reutilização de código dos componentes.

Documentação
Abrangendo os primeiros passos em programação visual, proporcionando detalhada apresentação de todos os elementos disponíveis, guia em todo processo de script, abrangente documentação para a aventura no mundo dos dados, mantendo-o seguro e próspero ao longo do caminho .

Open Source
Orange é open source com comunidade ativa. Você pode navegar e acessar o código fonte livremente, estender e reutilizar, participar de seu desenvolvimento, enquanto a comunidade fornece apoio, orientação e idéias.

Independência de Plataforma
Funciona em Windows, Mac OS X, e uma variedade de sistemas operacionais Linux.

20 de julho de 2012

Evernote


É uma aplicação que eu uso no PC do trabalho, no notebook, no tablet e no celular que tem me ajudado muito nas anotações que preciso fazer no dia a dia, tornando mais fácil lembrar de pequenas e grandes coisas diariamente.


Os dados são armazenados em nuvem e sincronizados automaticamente entre os dispositivos onde está instalada.


Os principais benefícios da aplicação são:

Sincronização - Com o Evernote, todas as suas notas, capturas da Web, arquivos e imagens são disponibilizados em cada dispositivo e computador que você usa.

Lembrar de tudo - Salve todas as coisas legais e empolgantes que você vê online e no mundo real. Tire uma foto, grave algum áudio e salve-o.

Salvar páginas favoritas da Web - Salve páginas da Web inteiras em sua conta do Evernote com as nossas fabulosas extensões para navegadores Web Clipper. Você obtém a página inteira: textos, imagens e links.

Pesquisar melhor - Colete informações de qualquer lugar em um único local. De notas de texto a páginas da Web e arquivos para instantâneos, tudo estará sempre à sua disposição.

Compartilhamento e Colaboração - Compartilhe as suas notas e colabore em projetos com amigos, colegas e colegas de turma.

Planejamento - Mantenha todos os seus itinerários, confirmações, documentos de viagens digitalizados, mapas e planos no Evernote. Assim, eles estarão disponíveis quando você precisar deles.

Disponivel para Windows, MAC, Android, IOS, Blackberry e Windows Phone.
Plugins para Firefox, Safari e Chrome.

Videoaulas Disciplinas da Área de TI


Hoje recebi um link muito interessante, e resolvi postar aqui para futuras consultas. É uma biblioteca de videoaulas que a Fundação CECIERJ/Consórcio CEDERJ em parceria com a RNP (Rede Nacional de Ensino e Pesquisa) disponibiliza, ao público em geral.

Vale a pena dar uma verificada e guardar o link nos favoritos.

13 de julho de 2012

Talend Open Studio - Ferramenta ETL


Open Source Extract-Transform-Load Overview (ETL) 


O ETL (Extract-Transform-Load) é um dos processos mais críticos de BI e de aplicativos de data warehouse.

O que é ETL?
O processo ETL consiste de três sub-processos (Extract, Transform e Load) que são usados ​​para transferir dados de sistemas de produção para o armazenamento no local onde eles serão “consumidos” por aplicações de BI.

Os três processos são:
  1. Extract – Extração dos dados das bases de dados das aplicações de produção.
  2. Transform - Transformar os dados para reconciliá-los através de sistemas de origem, incluindo a limpeza necessária de dados. Esses dados também são transformados para atender às exigências dos sistemas de destino (esquema em estrela, dimensões de mudança lenta, etc.
  3. Load - O carregamento dos dados transformados para o Data Warehouse, Data Marts e outras aplicações de BI.
A maioria das aplicações proprietárias de integração de dados e ETL foram projetados para uso em grandes projetos, como data warehouse ou gerenciamento "mestre" de dados. Estas aplicações tinham ou têm licenças caras e necessidades de equipes de especialistas para implementar os trabalhos de consultoria.

Recentemente, tem havido uma ascensão de software Open Source ETL. Os dois líderes neste campo são QlikView, Pentaho Data Integration e Talend Open Studio.


Talend Open Studio está disponível para Windows, Linux e Mac. É uma ferramenta gráfica que funciona integrada com a plataforma Eclipse.

Talend Open Source Integration Suite contém as principais características que se espera das ferramentas proprietárias, praticamente sem custos de suporte e sem custos de licenciamento iniciais.

Os principais recursos do Talend Open Source Integration Suite incluem:

Modell Bussines - oferece uma abordagem top-down com GUI para o desenho dos processos de integração de ETL a partir de uma perspectiva do negócio.

Designer Job - Um designer gráfico e funcional dos processos reais de ETL usando uma paleta gráfica de componentes e conectores.
Metadata Manager - fornece um repositório de metadados que centraliza todos os aspectos da concepção e execução.
Data Cleaning Profiling capabilities (oferecido como parte do perfil de dados Talend e Limpeza).
Job Conductor - coordenadas e horários da execução de todos os trabalhos, inclusive com base em eventos de programação para integração em tempo real.
Grid Conductor - distribui o trabalho em toda uma rede de servidores de execução e realiza balanceamento de carga automático e failover.
Execution Monitoring performed - Monitoramento da execução realizada por meio de:

  1. Activity Monitor atividades que monitora eventos de trabalho de execução (sucessos, fracassos, etc), tempos de execução e volumes de dados. 
  2. Activity Monitoring Dashboard - Painel de Monitoramento das atividades que oferece uma visão de negócios orientada para o Console Activity Monitoring através de uma interface web e em tempo real usando medidores e indicadores de status. Os gerentes de negócios serão capaz de ver o status atual e histórico de dados associados com qualquer trabalho.
Características gerais de Talend Open Studio


"O programa possui uma ferramenta para modelagem que auxilia os profissionais do mundo dos negócios a relacionarem as atividades de design com todas as etapas de um processo específico. A opção que realiza isto é a “Business Modeler”, e por meio de uma caixa de ferramentas muito intuitiva, o usuário pode organizar todos os processos, garantindo que estas informações sejam recuperadas no futuro.

Talend Open Studio oferece o “Component Library”, que é uma biblioteca com mais de 80 componentes e conectores para você desenvolver seus mapas e funções de integração. Se quiser, pode estender as opções de componentes criando padrões nas linguagens de Perl, Java ou SQL.

Solução para integração de dados

Todos os metadados trabalhados com o Talend Open Studio ficam armazenados em um repositório de metadados (Metadata Repository). Assim, todas as informações de projetos ficam salvas por módulos e podem rapidamente ter seus processo integrados.

O programa ainda conta com um depurador poderoso e outras soluções para que você possa integrar todos os dados de seus projetos com rapidez e segurança. A arquitetura e interface em geral permitem que o manuseio com o programa seja feito de maneira simples e em muitos casos intuitiva."