Por Kajal Yadav, um escritor freelancer sobre ciência de dados, startups & empreendedorismo.

Source Unsplash, editado pelo autor.

Você está animado para entrar no mundo da Ciência de Dados? Parabéns! Essa ainda é a escolha certa por causa do impulso final na necessidade de trabalho feito em Ciência de Dados e Inteligência Artificial durante esta pandemia.

Embora, por causa da crise, o mercado atualmente fica mais difícil de ser capaz de configurá-lo novamente com mais força masculina como eles estão fazendo antes. Assim, é possível que você tenha que se preparar mentalmente para a longa jornada de contratação e muitas rejeições pelo caminho.

Aqui, enquanto escrevo este artigo, estou assumindo que você já sabe que um portfólio de ciência de dados é crucial e como construí-lo.
Pode passar a maior parte do seu tempo a fazer crunching e wrangling de dados e não aplicar modelos extravagantes.

Uma pergunta que tenho feito aos entusiastas da ciência dos dados é que tipo de projectos devem incluir no seu portfolio para construir um portfolio tremendamente bom e único.

Below Eu dou 8 idéias únicas para o seu portfólio de ciência de dados com artigos de referência anexos de onde você obterá as idéias de como começar com qualquer idéia em particular.

Análise de sentimentos para depressão baseada em posts de mídia social

Foto por dole777 em Unsplash.

Este tópico é tão sensível para ser considerado hoje em dia e na necessidade urgente de fazer algo sobre ele. Existem mais de 264 milhões de indivíduos em todo o mundo que sofrem de depressão. A depressão é a principal causa de incapacidade em todo o mundo e é um importante defensor da carga global da doença, e quase 800.000 indivíduos mordem o pó consistentemente por causa do suicídio todos os anos. O suicídio é a segunda razão para a morte de crianças entre 15 e 29 anos. O tratamento para a depressão é frequentemente retardado, impreciso ou completamente perdido.

A vida baseada na Internet dá a principal chance de mudar os serviços de mediação da melancolia precoce, especialmente em jovens adultos. Consistentemente, aproximadamente 6.000 Tweets são tweeted no Twitter, o que se refere a mais de 350.000 tweets enviados para cada momento, 500 milhões de tweets para cada dia, e cerca de 200 bilhões de tweets para cada ano.

Como indicado pelo Pew Research Center, 72% do público usa algum tipo de vida baseada na internet. Datasets liberados de redes sociais são importantes para inúmeros campos, por exemplo, ciência humana e pesquisa cerebral. Mas os suportes de um ponto de vista especializado estão muito longe de ser suficientes, e metodologias explícitas estão desesperadamente sem sorte.

Ao analisar marcadores linguísticos em posts de redes sociais, é possível criar um modelo de aprendizagem profunda que pode dar uma visão individual da sua saúde mental muito antes das abordagens tradicionais.

  • You Are What You Tweet – Detecting Depression in Social Media via Twitter Useage
  • Early Detection of Depression: Social Network Analysis and Random Forest Techniques – Original paper, University of A Coruna.
  • Depressão de dados de redes sociais usando técnicas de aprendizagem de máquinas

Sports match video to text summarization using neural network

Photo by Aksh yadav on Unsplash.

Então esta idéia de projeto é basicamente baseada em obter um resumo preciso de vídeos de jogos esportivos. Existem sites de esportes que contam sobre os destaques do jogo. Vários modelos foram propostos para a tarefa de resumo de texto extractivo, mas as redes neurais fazem o melhor trabalho. Como regra, o resumo alude à introdução de informações em uma breve estrutura, concentrando-se em partes que transmitem fatos e informações, salvaguardando a importância.

Automaticamente criar um esboço de um vídeo de jogo dá origem ao desafio de distinguir minutos ou destaques fascinantes de um jogo.

Assim, pode-se conseguir isso usando algumas técnicas de aprendizagem profunda como 3D-CNN (redes tridimensionais convolucionais), RNN (rede neural recorrente), LSTM (redes de memória de curto prazo), e também através de algoritmos de aprendizagem de máquinas, dividindo o vídeo em diferentes seções e depois aplicando SVM (máquinas vetoriais de suporte), NN (redes neurais), e algoritmos k significaans.

Para melhor compreensão, consulte o artigo anexo em detalhes.

  • Classificação de Cenas para Sumarização de Vídeo Esportivo Usando a Aprendizagem por Transferência – Este artigo propõe um novo método para a classificação de cenas de vídeo esportivo.

Solucionador de equações manuscritas usando CNN

Foto por Antoine Dautry em Unsplash.

Entre todas as questões, o reconhecimento de expressões matemáticas manuscritas é uma das questões confusas na região da pesquisa de visão por computador. Você pode treinar um solucionador de equações manuscritas por dígitos e símbolos matemáticos usando Convolutional Neural Network (CNN) com algumas técnicas de processamento de imagem. O desenvolvimento de tal sistema requer o treinamento de nossas máquinas com dados, tornando-o proficiente no aprendizado e na realização da previsão necessária.

Ver os artigos abaixo para melhor entendimento.

  • Solvente de equações manuscritas usando Rede Neural Convolucional
  • vipul79321/Handwritten-Equation-Solver – Um solver de equações manuscritas usando Equação CNN pode conter qualquer dígito de 0-9 e símbolo.
  • Computer Vision – Classificação automática das folhas de respostas matemáticas manuscritas – Digitalização dos passos para resolver uma equação matemática escrita à mão livre num papel.
  • Equações manuscritas para LaTeX

Geração de resumo de reunião de negócios usando NLP

Foto de Sebastian Herrmann em Unsplash.

Entrou numa situação em que todos querem ver um resumo e não o relatório completo? Bem, eu o enfrentei durante meus dias de escola e faculdade, onde passamos muito tempo preparando um relatório inteiro, mas o professor só tem tempo para ler o resumo.

Aummarização surgiu como uma forma inexoravelmente útil de lidar com a questão da sobrecarga de dados. Extrair informação de conversas pode ser de muito bom valor comercial e educacional. Isto pode ser feito através da captura dos aspectos estatísticos, linguísticos e sentimentais com a estrutura de diálogo da conversa.

Mudar manualmente o relatório para uma forma resumida é muito demorado, não é verdade? Mas pode-se confiar nas técnicas de Processamento de Linguagem Natural (PNL) para conseguir isso.

Resumo de texto usando aprendizado profundo pode entender o contexto de todo o texto. Não é um sonho tornado realidade para todos nós que precisamos de fazer um resumo rápido de um documento!

Ver os artigos abaixo para melhor compreensão.

  • Guia Abrangente para Resumir Texto usando Aprendizagem Profunda em Python – “Eu não quero um relatório completo, apenas me dê um resumo dos resultados.”
  • Entenda Sumarização de Texto e crie seu próprio sumarizador em python – A sumarização pode ser definida como uma tarefa de produzir um resumo conciso e fluente enquanto preserva informações chave.

Conhecimento facial para detectar o humor e sugerir canções de acordo com ele

Foto por Alireza Attari em Unsplash.

O rosto humano é uma parte importante do corpo de um indivíduo, e desempenha um papel particularmente significativo no conhecimento do estado de espírito de uma pessoa. Isto elimina a tarefa monótona e tediosa de isolar ou agrupar canções manualmente em vários discos e ajuda a gerar uma playlist apropriada baseada nas características emocionais de um indivíduo.

As pessoas tendem a ouvir música com base no seu humor e interesses. Pode-se criar um aplicativo para sugerir músicas para os usuários com base em seu humor, capturando expressões faciais.

A visão computacional é um campo interdisciplinar que ajuda a transmitir uma compreensão de alto nível de imagens ou vídeos digitais para computadores. Os componentes de visão computacional podem ser usados para determinar a emoção do usuário através de expressões faciais.

Existem estas APIs, também, que achei interessantes e úteis. Entretanto, eu não trabalhei nelas, mas anexando aqui com a esperança de que elas o ajudarão.

  • 20+ APIs de reconhecimento de emoções que o deixarão impressionado e preocupado | APIs nórdicas – Se as empresas pudessem sentir emoções usando a tecnologia o tempo todo, elas poderiam aproveitá-la para vender ao consumidor.

Encontrar exo-planeta habitável a partir de imagens capturadas por veículos espaciais como Kepler

Foto por Nick Owuor (astro.nic.visuals) em Unsplash.

Na década mais recente, mais de um milhão de estrelas foram monitoradas para identificar planetas em trânsito. A interpretação manual de potenciais candidatos a exoplanetas é trabalhosa e sujeita a erros humanos, cujas consequências são difíceis de avaliar. Redes neurais convolucionais são adequadas para identificar exoplanetas semelhantes à Terra em dados ruidosos da série temporal com maior precisão do que uma estratégia de mínimos quadrados.

  • Caça de exoplanetas usando Machine Learning – Hunting worlds beyond our solar system.
  • Inteligência Artificial, Dados da NASA Usados para Descobrir Exoplaneta – Nosso sistema solar agora está ligado para a maioria dos planetas ao redor de uma única estrela.

Image regeneration for old damaged reel picture

Source Pikist.

Eu sei o quão demorado e doloroso é recuperar sua antiga foto danificada na forma original como era antes. Portanto, isto pode ser feito usando aprendizado profundo, encontrando todos os defeitos da imagem (fraturas, arranhões, buracos), e usando algoritmos de pintura, para que se possa facilmente descobrir os defeitos com base nos valores de pixel ao seu redor para restaurar e colorir as fotos antigas.

  • Colorir e Restaurar Imagens Antigas com Aprendizagem Profunda – Colorir imagens em preto e branco com aprendizagem profunda tornou-se uma vitrine impressionante para a aplicação no mundo real.
  • Guia para Pintura de Imagens: Usando aprendizado de máquina para editar e corrigir defeitos em fotos
  • Como Realizar Restauração de Imagem Absolutamente Livre de Dados

Geração de Música usando aprendizado profundo

Foto por Abigail Keenan em Unsplash.

Música é um sortimento de tons de várias freqüências. Assim, a geração automática de música é um processo de composição de uma curta peça musical com a menor mediação humana. Recentemente, a engenharia de aprendizagem profunda tornou-se a vanguarda para a geração de música programada.

  • Geração de música usando Aprendizagem Profunda
  • Como Gerar Música usando uma Rede Neural LSTM em Keras – Uma introdução à criação de música usando Redes Neurais LSTM

Palavra Final

Eu sei que é uma verdadeira luta para construir um portfólio de ciência de dados legal. Mas com tal coleção que eu forneci acima, você pode fazer progressos acima da média nesse campo. A coleção é nova, o que dá a oportunidade para fins de pesquisa também. Assim, os pesquisadores em Data Science também podem escolher essas idéias para trabalhar, para que a sua pesquisa seja uma grande ajuda para que os cientistas de dados comecem com o projeto. Além disso, é divertido explorar os lados que ninguém fez antes. Embora, esta coleção realmente constitua idéias do início ao nível avançado.

Então, eu vou recomendar isto não só para iniciantes na área de ciência de dados, mas também para cientistas de dados seniores. Ela abrirá muitos caminhos novos durante sua carreira, não só por causa dos projetos, mas também através da rede recém ganha.

Estas idéias mostram o amplo leque de possibilidades e lhe dão as idéias para pensar fora da caixa.

Para mim e meus amigos, os fatores de aprendizagem, agregando valor à sociedade, e o conhecimento inexplorado é importante, e a diversão de certa forma é essencial. Então, basicamente, eu gosto de fazer tais projetos que nos dão uma maneira de ganhar imenso conhecimento de uma maneira e nos permitem explorar as dimensões inexploradas. Esse é nosso foco principal ao dedicar tempo a tais projetos.

Original. Repostado com permissão.

Bio: Kajal Yadav é um escritor freelancer especializado em ciência de dados, startups e empreendedorismo. Ela escreve para várias publicações e ao mesmo tempo trabalha com startups em suas estratégias de marketing de conteúdo.

Related:

  • Start Your Machine Learning Career in Quarantine
  • Projetos para incluir em um Portfólio de Ciência de Dados
  • Como construir um Portfólio de Ciência de Dados

admin

Deixe uma resposta

O seu endereço de email não será publicado.

lg