Por Kajal Yadav, escritora freelance sobre ciencia de datos, startups &emprendimiento.
Fuente Unsplash, editado por la autora.
¿Estás emocionado por entrar en el mundo de la Ciencia de Datos? ¡¡¡Enhorabuena!!! Eso sigue siendo la elección correcta debido a la última impulso en la necesidad de trabajo realizado en Ciencia de Datos e Inteligencia Artificial durante esta pandemia.
Aunque, debido a la crisis, el mercado actualmente se hace más difícil para ser capaz de establecer de nuevo con más fuerza de los hombres como lo están haciendo antes. Por lo tanto, es posible que usted tiene que prepararse mentalmente para el viaje de contratación a largo plazo y muchos rechazos en el camino.
Así, al escribir este artículo, estoy asumiendo que usted ya sabe que una cartera de la ciencia de datos es crucial y cómo construirlo.
Puede que pases la mayor parte de tu tiempo haciendo crujidos de datos y luchando y no aplicando modelos de fantasía.
Una pregunta que me han hecho una y otra vez los entusiastas de la ciencia de datos es que qué tipo de proyectos deben incluir en su cartera para construir una cartera tremendamente buena y única.
A continuación te doy 8 ideas únicas para tu portafolio de ciencia de datos con artículos de referencia adjuntos de donde obtendrás las ideas de cómo empezar con cualquier idea en particular.
- Análisis de sentimiento para la depresión basado en publicaciones de medios sociales
- Resumen de vídeos de partidos deportivos a texto utilizando una red neuronal
- Solucionador de ecuaciones manuscritas usando CNN
- Generación de resúmenes de reuniones de negocios usando NLP
- Reconocimiento facial para detectar el estado de ánimo y sugerir canciones en consecuencia
- Descubrir exoplanetas habitables a partir de imágenes captadas por vehículos espaciales como Kepler
- Regeneración de imágenes para la vieja foto dañada del carrete
- Generación de música usando deep learning
- Palabra final
Foto de dole777 en Unsplash.
Este tema es tan sensible para ser considerado hoy en día y en la necesidad urgente de hacer algo al respecto. Hay más de 264 millones de personas en todo el mundo que sufren depresión. La depresión es la principal causa de discapacidad en todo el mundo y contribuye de forma significativa a la carga global de enfermedad, y casi 800.000 personas muerden el polvo de forma sistemática a causa del suicidio cada año. El suicidio es el segundo motivo de muerte entre los jóvenes de 15 a 29 años. El tratamiento de la depresión a menudo se retrasa, es impreciso o se omite por completo.
La vida en Internet ofrece la principal oportunidad de cambiar los servicios de mediación de la melancolía temprana, especialmente en adultos jóvenes. Constantemente, se tuitean aproximadamente 6.000 tweets en Twitter, lo que se relaciona con más de 350.000 tweets enviados por cada momento, 500 millones de tweets por cada día, y alrededor de 200 mil millones de tweets por cada año.
Según indica el Centro de Investigación Pew, el 72% del público utiliza algún tipo de vida basada en Internet. Los conjuntos de datos procedentes de las redes sociales son importantes para numerosos campos, por ejemplo, la ciencia humana y la investigación del cerebro. Pero los soportes desde un punto de vista especializado están muy lejos de ser suficientes, y las metodologías explícitas están desesperadamente fuera de juego.
Al analizar los marcadores lingüísticos en las publicaciones de las redes sociales, es posible crear un modelo de aprendizaje profundo que puede dar a un individuo una visión de su salud mental mucho antes que los enfoques tradicionales.
- Eres lo que tuiteas – Detección de la depresión en las redes sociales a través del uso de Twitter
- Detección temprana de la depresión: Social Network Analysis and Random Forest Techniques – Original paper, University of A Coruna.
- Detección de la depresión a partir de datos de redes sociales utilizando técnicas de aprendizaje automático
Resumen de vídeos de partidos deportivos a texto utilizando una red neuronal
Foto de Aksh yadav en Unsplash.
Así que esta idea de proyecto se basa básicamente en obtener un resumen preciso de los vídeos de partidos deportivos. Hay sitios web de deportes que cuentan lo más destacado del partido. Se han propuesto varios modelos para la tarea de resumen de texto extractivo, pero las redes neuronales son las que mejor funcionan. Por regla general, el resumen alude a la introducción de información en una estructura breve, concentrándose en las partes que transmiten hechos e información, salvaguardando la importancia.
La creación automática de un resumen de un vídeo de un partido plantea el reto de distinguir los minutos fascinantes o los momentos destacados de un partido.
Así, se puede lograr eso utilizando algunas técnicas de aprendizaje profundo como 3D-CNN (redes convolucionales tridimensionales), RNN (red neuronal recurrente), LSTM (redes de memoria a largo plazo), y también a través de algoritmos de aprendizaje automático dividiendo el video en diferentes secciones y luego aplicando algoritmos SVM (máquinas de vectores de soporte), NN (redes neuronales), y k-means.
Para una mejor comprensión, consulte el artículo adjunto en detalle.
- Clasificación de escenas para la integración de vídeos deportivos utilizando el aprendizaje de transferencia – Este artículo propone un método novedoso para la clasificación de escenas de vídeos deportivos.
Solucionador de ecuaciones manuscritas usando CNN
Foto de Antoine Dautry en Unsplash.
Entre todas las cuestiones, el reconocimiento de expresiones matemáticas manuscritas es uno de los temas confusos en la región de la investigación en visión por ordenador. Se puede entrenar un solucionador de ecuaciones manuscritas mediante dígitos manuscritos y símbolos matemáticos utilizando redes neuronales convolucionales (CNN) con algunas técnicas de procesamiento de imágenes. El desarrollo de un sistema de este tipo requiere el entrenamiento de nuestras máquinas con los datos, por lo que es competente en el aprendizaje y hacer la predicción requerida.
Consulte los artículos adjuntos a continuación para una mejor comprensión.
- Solucionador de ecuaciones manuscritas utilizando la red neuronal convolucional
- vipul79321/Handwritten-Equation-Solver – Un solucionador de ecuaciones manuscritas utilizando CNN La ecuación puede contener cualquier dígito de 0-9 y símbolo.
- Visión por computador – Calificación automática de hojas de respuestas matemáticas escritas a mano – Digitalización de los pasos de resolución de una ecuación matemática escrita a mano alzada en un papel.
- Ecuaciones escritas a mano en LaTeX
Generación de resúmenes de reuniones de negocios usando NLP
Foto de Sebastian Herrmann en Unsplash.
¿Alguna vez te has encontrado en una situación en la que todos quieren ver un resumen y no el informe completo? Pues bien, yo me enfrenté a ello en mi época escolar y universitaria, en la que dedicamos mucho tiempo a preparar un informe completo, pero el profesor sólo tiene tiempo de leer el resumen.
La sintetización se ha alzado como una forma inexorablemente útil de abordar el problema de la sobrecarga de datos. Extraer información de las conversaciones puede tener un gran valor comercial y educativo. Esto puede hacerse mediante la captura de características de los aspectos estadísticos, lingüísticos y sentimentales con la estructura de diálogo de la conversación.
Cambiar manualmente el informe a una forma resumida lleva demasiado tiempo, ¿no es así? Pero se puede confiar en las técnicas de Procesamiento del Lenguaje Natural (PLN) para conseguirlo.
El resumen de texto utilizando el aprendizaje profundo puede entender el contexto de todo el texto. No es un sueño hecho realidad para todos los que necesitamos llegar a un resumen rápido de un documento!
Consulte los artículos adjuntos a continuación para una mejor comprensión.
- Guía completa de resumen de texto utilizando el aprendizaje profundo en Python – «No quiero un informe completo, sólo dame un resumen de los resultados.»
- Entiende la Resumificación de Textos y crea tu propio resumidor en python – La Resumificación se puede definir como una tarea de producir un resumen conciso y fluido preservando la información clave.
Reconocimiento facial para detectar el estado de ánimo y sugerir canciones en consecuencia
Foto de Alireza Attari en Unsplash.
El rostro humano es una parte importante del cuerpo de un individuo, y en particular juega un papel significativo para conocer el estado de ánimo de una persona. Esto elimina la aburrida y tediosa tarea de aislar o agrupar manualmente las canciones en varios registros y ayuda a generar una lista de reproducción adecuada basada en las características emocionales de un individuo.
La gente tiende a escuchar música en función de su estado de ánimo y sus intereses. Se puede crear una aplicación que sugiera canciones a los usuarios en función de su estado de ánimo mediante la captura de expresiones faciales.
La visión por ordenador es un campo interdisciplinar que ayuda a transmitir a los ordenadores una comprensión de alto nivel de las imágenes o vídeos digitales. Los componentes de visión por ordenador pueden utilizarse para determinar la emoción del usuario a través de las expresiones faciales.
También existen estas APIs, que me parecieron interesantes y útiles. Sin embargo, no he trabajado en ellas, pero las adjunto aquí con la esperanza de que te ayuden.
- 20+ APIs de reconocimiento de emociones que te dejarán impresionado, y preocupado | APIs nórdicas – Si las empresas pudieran percibir las emociones utilizando la tecnología en todo momento, podrían aprovecharlas para vender al consumidor.
Descubrir exoplanetas habitables a partir de imágenes captadas por vehículos espaciales como Kepler
Foto de Nick Owuor (astro.nic.visuals) en Unsplash.
En la década más reciente, se monitorearon más de un millón de estrellas para identificar planetas en tránsito. La interpretación manual de los posibles candidatos a exoplanetas requiere mucho trabajo y está sujeta a errores humanos, cuyas consecuencias son difíciles de evaluar. Las redes neuronales convolucionales son aptas para identificar exoplanetas similares a la Tierra en datos de series temporales ruidosos con una precisión más destacada que una estrategia de mínimos cuadrados.
- Caza de exoplanetas mediante aprendizaje automático – Cazando mundos más allá de nuestro sistema solar.
- Inteligencia artificial, datos de la NASA utilizados para descubrir exoplanetas – Nuestro sistema solar ahora está empatado por el mayor número de planetas alrededor de una sola estrella.
Regeneración de imágenes para la vieja foto dañada del carrete
Fuente Pikist.
Sé lo que consume tiempo y es doloroso para recuperar su vieja foto dañada en la forma original como era antes. Por lo tanto, esto se puede hacer utilizando el aprendizaje profundo mediante la búsqueda de todos los defectos de la imagen (fracturas, raspaduras, agujeros), y el uso de algoritmos de inpainting, de modo que uno puede descubrir fácilmente los defectos sobre la base de los valores de los píxeles alrededor de ellos para restaurar y colorear las fotos antiguas.
- Colorear y restaurar imágenes antiguas con el aprendizaje profundo – Colorear imágenes en blanco y negro con el aprendizaje profundo se ha convertido en un escaparate impresionante para la aplicación en el mundo real.
- Guide to Image Inpainting: Usando el aprendizaje automático para editar y corregir defectos en las fotos
- Cómo realizar una restauración de imágenes absolutamente libre de datos
Generación de música usando deep learning
Foto de Abigail Keenan en Unsplash.
La música es un surtido de tonos de varias frecuencias. Así, la generación automática de música es un proceso de composición de una pieza musical corta con la menor mediación humana. Recientemente, la ingeniería de aprendizaje profundo se ha convertido en la vanguardia para la generación de música programada.
- Generación de música usando Deep Learning
- Cómo generar música usando una red neuronal LSTM en Keras – Una introducción a la creación de música usando redes neuronales LSTM
Palabra final
Sé que es una verdadera lucha para construir una cartera de ciencia de datos genial. Pero con la colección que te he proporcionado arriba, puedes progresar por encima de la media en ese campo. La colección es nueva, lo que da la oportunidad de investigar también. Por lo tanto, los investigadores en Ciencia de Datos también pueden elegir estas ideas para trabajar, de modo que su investigación sería una gran ayuda para los Científicos de Datos para comenzar con el proyecto. Además, es divertido explorar los lados que nadie ha hecho antes. Aunque, esta colección realmente constituye ideas desde el principio hasta los niveles avanzados.
Así que, no sólo voy a recomendar esto para los novatos en el área de la ciencia de datos, sino también los científicos de datos de alto nivel. Abrirá muchos nuevos caminos durante su carrera, no sólo debido a los proyectos, sino también a través de la red recién adquirida.
Estas ideas te muestran la amplia gama de posibilidades y te dan las ideas para pensar fuera de la caja.
Para mí y mis amigos, los factores de aprendizaje, la adición de valor a la sociedad, y el conocimiento inexplorado es importante, y la diversión en cierto modo es esencial. Así que, básicamente, me gusta hacer este tipo de proyectos que nos dan una forma de obtener un inmenso conocimiento en cierto modo y nos permiten explorar las dimensiones inexploradas. Ese es nuestro principal objetivo al dedicar tiempo a tales proyectos.
Original. Republicado con permiso.
Bio: Kajal Yadav es una escritora freelance especializada en ciencia de datos, startups y emprendimiento. Escribe para varias publicaciones y al mismo tiempo trabaja con startups en sus estrategias de marketing de contenidos.
Relación:
- Inicia tu carrera de aprendizaje automático en cuarentena
- Proyectos a incluir en un portafolio de ciencia de datos
- Cómo construir un portafolio de ciencia de datos