¿Estás ilusionado con entrar en el mundo de la Ciencia de Datos?
¡Felicidades! Esa sigue siendo la elección correcta debido al impulso definitivo en la necesidad de trabajo realizado en Ciencia de Datos e Inteligencia Artificial durante esta pandemia.
Aunque, debido a la crisis, el mercado actualmente se vuelve más duro para poder establecerlo de nuevo con más fuerza de hombres como lo están haciendo antes. Por lo tanto, es posible que usted tiene que prepararse mentalmente para el viaje de contratación a largo plazo y muchos rechazos en un camino.
Así, al escribir este artículo, estoy asumiendo que usted ya ha conocido que la cartera de la ciencia de datos es crucial y cómo construirlo.
Puede que pases la mayor parte de tu tiempo, haciendo crujidos de datos y luchando y no aplicando modelos de fantasía.
Una pregunta que me han hecho una y otra vez los entusiastas de la ciencia de datos es que qué tipo de proyectos deben incluir en su cartera para construir una cartera tremendamente buena y única.
Abajo he dado las 8 ideas únicas para su cartera de ciencia de datos con artículos de referencia adjuntos desde donde obtendrá las ideas de cómo empezar con cualquier idea en particular.
Este tema es tan sensible para ser considerado hoy en día y en la necesidad urgente de hacer algo al respecto. Hay más de 264 millones de individuos en el mundo que sufren de depresión. La depresión es la principal causa de discapacidad en todo el mundo y contribuye de forma significativa a la carga global de enfermedad, y casi 800.000 personas muerden el polvo cada año a causa del suicidio. El suicidio es el segundo motivo de muerte entre los jóvenes de 15 a 29 años. El tratamiento de la depresión a menudo se retrasa, es impreciso y/o se omite por completo.
La vida en Internet ofrece la principal oportunidad de cambiar los servicios de mediación de la melancolía temprana, especialmente en los adultos jóvenes. Constantemente, se tuitean aproximadamente 6.000 tweets en Twitter, lo que se relaciona con más de 350.000 tweets enviados por cada momento, 500 millones de tweets por cada día, y alrededor de 200 mil millones de tweets por cada año.
Según indica el Centro de Investigación Pew, el 72% del público utiliza algún tipo de vida basada en Internet. Los conjuntos de datos procedentes de las redes sociales son importantes para numerosos campos, por ejemplo, la ciencia humana y la investigación del cerebro. Pero los soportes desde un punto de vista especializado están muy lejos de ser suficientes, y las metodologías explícitas están desesperadamente fuera de juego.
Al analizar los marcadores lingüísticos en las publicaciones de las redes sociales, es posible crear un modelo de aprendizaje profundo que puede dar a un individuo una visión de su salud mental mucho antes que los enfoques tradicionales.
- Resumen de vídeos de partidos deportivos a texto utilizando una red neuronal
- Resolución de ecuaciones manuscritas mediante CNN
- Generación de resúmenes de reuniones de negocios utilizando PNL
- Reconocimiento facial para detectar el estado de ánimo y sugerir canciones en consecuencia
- Descubriendo exoplanetas habitables a partir de imágenes captadas por vehículos espaciales como Kepler
- Regeneración de imagen para una vieja foto de carrete dañada
- Generación de música mediante aprendizaje profundo
- Palabra final
Resumen de vídeos de partidos deportivos a texto utilizando una red neuronal
Así que esta idea de proyecto se basa básicamente en obtener un resumen preciso de los vídeos de partidos deportivos. Hay sitios web de deportes que cuentan lo más destacado del partido. Se han propuesto varios modelos para la tarea de resumen de texto extractivo, pero las redes neuronales son las que mejor funcionan. Por regla general, la Resumización alude a la introducción de información en una estructura breve, concentrándose en las partes que transmiten hechos e información, salvaguardando la importancia.
La creación automática de un resumen de un vídeo de un partido da lugar al reto de distinguir los minutos fascinantes, o momentos destacados, de un partido.
Así, se puede lograr eso usando algunas técnicas de aprendizaje profundo como 3D-CNN (redes convolucionales tridimensionales), RNN(Red neuronal recurrente), LSTM (Redes de memoria a largo plazo) y también a través de algoritmos de aprendizaje automático dividiendo el video en diferentes secciones y luego aplicando SVM(Máquinas de vectores de apoyo), NN(Redes neuronales), algoritmo k-means.
Para una mejor comprensión, consulte los artículos adjuntos en detalle.
Resolución de ecuaciones manuscritas mediante CNN
Entre todas las cuestiones, el reconocimiento de expresiones matemáticas manuscritas es una de las que más confunde en la región de la investigación en visión por ordenador. Se puede entrenar un solucionador de ecuaciones manuscritas mediante dígitos manuscritos y símbolos matemáticos utilizando una red neuronal convolucional (CNN) con algunas técnicas de procesamiento de imágenes. El desarrollo de un sistema de este tipo requiere el entrenamiento de nuestras máquinas con datos, haciéndolas competentes para aprender y hacer la predicción requerida.
Referirse a los artículos adjuntos a continuación para una mejor comprensión.
Generación de resúmenes de reuniones de negocios utilizando PNL
Alguna vez te has encontrado en una situación en la que todo el mundo quiere ver un resumen y no informes completos. Bueno, yo me enfrenté a ello durante mis días de escuela y universidad, donde pasamos mucho tiempo preparando un informe completo, pero el profesor sólo tiene tiempo para leer el resumen.
La sintetización se ha alzado como una forma inexorablemente útil de abordar el problema de la sobrecarga de datos. Extraer información de las conversaciones puede tener un gran valor comercial y educativo. Esto puede hacerse mediante la captura de características de los aspectos estadísticos, lingüísticos y sentimentales con la estructura de diálogo de la conversación.
Cambiar manualmente el informe a una forma resumida lleva demasiado tiempo, ¿no es así? Pero se puede confiar en las técnicas de Procesamiento del Lenguaje Natural (PLN) para conseguirlo.
El resumen de texto utilizando el aprendizaje profundo puede entender el contexto de todo el texto. ¿No es un sueño hecho realidad para todos los que necesitamos hacer un resumen rápido de un documento?
Reconocimiento facial para detectar el estado de ánimo y sugerir canciones en consecuencia
El rostro humano es una parte importante del cuerpo de un individuo y, en particular, desempeña un papel significativo para conocer el estado de ánimo de una persona. Esto elimina la aburrida y tediosa tarea de aislar o agrupar manualmente las canciones en varios registros y ayuda a generar una lista de reproducción adecuada basada en las características emocionales de un individuo.
La gente tiende a escuchar música en función de su estado de ánimo y sus intereses. Se puede crear una aplicación que sugiera canciones a los usuarios en función de su estado de ánimo mediante la captura de expresiones faciales.
La visión por ordenador es un campo interdisciplinar que ayuda a transmitir a los ordenadores una comprensión de alto nivel de las imágenes digitales o los vídeos.Los componentes de visión por ordenador se pueden utilizar para determinar la emoción del usuario a través de las expresiones faciales.
También hay estas APIs que me han parecido interesantes y útiles, aunque no he trabajado en ellas pero las adjunto aquí con la esperanza de que os ayuden.
Descubriendo exoplanetas habitables a partir de imágenes captadas por vehículos espaciales como Kepler
En la década más reciente, se monitorearon más de un millón de estrellas para identificar planetas en tránsito. La interpretación manual de los posibles candidatos a exoplanetas requiere mucho trabajo y está sujeta a errores humanos, cuyas consecuencias son difíciles de evaluar. Las redes neuronales convolucionales son aptas para identificar exoplanetas similares a la Tierra en datos de series temporales ruidosos con una precisión más destacada que una estrategia de mínimos cuadrados.
Regeneración de imagen para una vieja foto de carrete dañada
Sé, cómo consume tiempo y es doloroso recuperar su vieja foto dañada en la forma original como era antes. Por lo tanto, esto se puede hacer utilizando el aprendizaje profundo mediante la búsqueda de todos los defectos de la imagen (fracturas, raspaduras, agujeros), y el uso de algoritmos de Inpainting, uno puede descubrir fácilmente los defectos sobre la base de los valores de los píxeles alrededor de ellos para restaurar y colorear las fotos antiguas.
Generación de música mediante aprendizaje profundo
La música es un surtido de tonos de varias frecuencias. Así, la Generación Automática de Música es un proceso de composición de una pieza musical corta con la menor mediación humana . Recientemente, la ingeniería de Aprendizaje Profundo se ha convertido en la vanguardia para la Generación de Música programada.
Palabra final
Sé que es una verdadera lucha para construir un portafolio de ciencia de datos genial. Pero con tal colección que he proporcionado arriba, usted puede hacer un progreso por encima de la media en ese campo. La colección es nueva, lo que da la oportunidad de investigar también. Por lo tanto, los investigadores en Ciencia de Datos también pueden elegir estas ideas para trabajar en lo que su investigación sería una gran ayuda para los científicos de datos para comenzar con el proyecto. Y además, es una verdadera diversión para explorar los lados que nadie ha hecho antes.
Aunque, esta colección es en realidad constituyen de las ideas de principio a nivel avanzado.
Así que, no sólo voy a recomendar esto para los novatos en el área de la ciencia de datos, sino también los científicos de datos de alto nivel. Abrirá muchos nuevos caminos durante su carrera, no sólo debido a los proyectos, sino también a través de la red recién adquirida.
Estas ideas te muestran la amplia gama de posibilidades y te dan las ideas para pensar fuera de la caja.
Para mí y mis amigos, los factores de aprendizaje, la adición de valor a la sociedad y el conocimiento inexplorado es importante y la diversión en cierto modo es esencial. Así que, básicamente, me gusta hacer este tipo de proyectos que nos dan una forma de ganar un inmenso conocimiento de una manera y nos permiten explorar las dimensiones inexploradas. Ese es nuestro principal objetivo al dedicar tiempo a tales proyectos.