Sind Sie aufgeregt, in die Welt der Data Science einzusteigen?
Glückwunsch! Das ist immer noch die richtige Wahl, weil der Bedarf an Data Science und künstlicher Intelligenz während dieser Pandemie enorm gestiegen ist.
Allerdings wird der Markt wegen der Krise derzeit härter, um ihn wieder mit mehr Männern zu besetzen, als sie es früher getan haben. Es könnte also sein, dass Sie sich mental auf eine lange Einstellungsreise und viele Ablehnungen einstellen müssen.
Während ich diesen Artikel schreibe, gehe ich davon aus, dass Sie bereits wissen, dass ein Data-Science-Portfolio entscheidend ist und wie man es aufbaut.
Du verbringst die meiste Zeit damit, Daten zu sammeln und zu verarbeiten und nicht damit, ausgefallene Modelle anzuwenden.
Eine Frage, die mir immer wieder von Data-Science-Enthusiasten gestellt wird, ist, welche Art von Projekten sie in ihr Portfolio aufnehmen sollten, um ein enorm gutes und einzigartiges Portfolio aufzubauen.
Nachfolgend habe ich 8 einzigartige Ideen für Ihr Data-Science-Portfolio mit angehängten Referenzartikeln aufgeführt, aus denen Sie einen Einblick erhalten, wie Sie mit einer bestimmten Idee beginnen können.
Dieses Thema ist so sensibel, dass man heutzutage dringend etwas dagegen tun muss. Weltweit gibt es mehr als 264 Millionen Menschen, die an einer Depression leiden. Depressionen sind weltweit die Hauptursache für Behinderungen und tragen wesentlich zur globalen Krankheitslast bei. Jedes Jahr sterben fast 800.000 Menschen durch Selbstmord. Selbstmord ist die zweithäufigste Todesursache bei den 15-29-Jährigen. Die Behandlung von Depressionen wird häufig verzögert, unpräzise durchgeführt und/oder ganz versäumt.
Das internetgestützte Leben bietet die große Chance, die frühzeitige Vermittlung von Melancholie zu verändern, insbesondere bei jungen Erwachsenen. Ständig werden etwa 6.000 Tweets auf Twitter getwittert, was mehr als 350.000 Tweets pro Moment, 500 Millionen Tweets pro Tag und etwa 200 Milliarden Tweets pro Jahr entspricht.
Wie das Pew Research Center angibt, nutzen 72 % der Öffentlichkeit eine Art von internetbasiertem Leben. Die von sozialen Netzwerken freigegebenen Daten sind für zahlreiche Bereiche wichtig, zum Beispiel für die Humanwissenschaften und die Hirnforschung. Aber die Unterstützung aus fachlicher Sicht reicht bei weitem nicht aus, und explizite Methoden sind hoffnungslos überfordert.
Durch die Analyse sprachlicher Marker in Social-Media-Beiträgen ist es möglich, ein Deep-Learning-Modell zu erstellen, das weit früher als herkömmliche Ansätze Aufschluss über die psychische Gesundheit einer Person geben kann.
- Zusammenfassung von Sportvideos in Text mit Hilfe eines neuronalen Netzwerks
- Handschriftlicher Gleichungslöser mit CNN
- Zusammenfassung von Geschäftsbesprechungen mit NLP
- Gesichtserkennung erkennt Stimmungen und schlägt dementsprechend Lieder vor
- Finden von bewohnbaren Exoplaneten anhand von Bildern, die von Raumfahrzeugen wie Kepler aufgenommen wurden
- Bildregenerierung für altes beschädigtes Rollenbild
- Musikgenerierung mit Deep Learning
- FINAL WORD
Zusammenfassung von Sportvideos in Text mit Hilfe eines neuronalen Netzwerks
Diese Projektidee basiert also im Wesentlichen darauf, aus Sportvideos präzise Zusammenfassungen zu erstellen. Es gibt Sport-Websites, die über die Höhepunkte des Spiels berichten. Es wurden verschiedene Modelle für die Aufgabe der extraktiven Textzusammenfassung vorgeschlagen, aber neuronale Netze leisten die beste Arbeit. In der Regel geht es bei der Zusammenfassung darum, Informationen in einer kurzen Struktur darzustellen und sich dabei auf die Teile zu konzentrieren, die Fakten und Informationen vermitteln, wobei die Wichtigkeit gewahrt bleibt.
Die automatische Erstellung einer Zusammenfassung eines Spielvideos bringt die Herausforderung mit sich, spannende Minuten oder Höhepunkte eines Spiels zu erkennen.
Das kann man mit Hilfe einiger Deep-Learning-Techniken wie 3D-CNN (dreidimensionale Faltungsnetzwerke), RNN (rekurrentes neuronales Netzwerk), LSTM (Long Short Term Memory-Netzwerke) und auch durch Algorithmen des maschinellen Lernens erreichen, indem man das Video in verschiedene Abschnitte unterteilt und dann SVM (Support Vector Machines), NN (neuronale Netzwerke), k-means-Algorithmus anwendet.
Zum besseren Verständnis lesen Sie bitte die beigefügten Artikel im Detail.
Handschriftlicher Gleichungslöser mit CNN
Die Erkennung handgeschriebener mathematischer Ausdrücke ist eines der schwierigsten Probleme im Bereich der Computer Vision Forschung. Man kann handschriftliche Gleichungslöser mit handgeschriebenen Ziffern und mathematischen Symbolen trainieren, indem man Convolutional Neural Network (CNN) mit einigen Bildverarbeitungstechniken einsetzt. Um ein solches System zu entwickeln, müssen unsere Maschinen mit Daten trainiert werden, damit sie lernen und die erforderliche Vorhersage treffen können.
Zum besseren Verständnis lesen Sie bitte die unten angefügten Artikel.
Zusammenfassung von Geschäftsbesprechungen mit NLP
Sind Sie schon einmal in eine Situation geraten, in der jeder eine Zusammenfassung und keinen vollständigen Bericht sehen möchte? Ich kenne das aus meiner Schul- und Studienzeit, in der wir viel Zeit damit verbracht haben, einen ganzen Bericht vorzubereiten, der Lehrer aber nur Zeit hatte, die Zusammenfassung zu lesen.
Die Zusammenfassung hat sich als unaufhaltsam hilfreicher Weg erwiesen, um das Problem der Datenflut zu bewältigen. Die Extraktion von Informationen aus Gesprächen kann von großem kommerziellen und pädagogischen Wert sein. Dies kann durch die Erfassung der statistischen, sprachlichen und gefühlsmäßigen Aspekte mit der Dialogstruktur des Gesprächs geschehen.
Die manuelle Umwandlung des Berichts in eine zusammengefasste Form ist zu zeitaufwendig, nicht wahr? Aber man kann sich auf Techniken der natürlichen Sprachverarbeitung (NLP) verlassen, um das zu erreichen.
Die Textzusammenfassung mit Deep Learning kann den Kontext des gesamten Textes verstehen. Ist das nicht ein wahrgewordener Traum für alle, die eine schnelle Zusammenfassung eines Dokuments benötigen?
Zum besseren Verständnis lesen Sie bitte die unten angefügten Artikel.
Gesichtserkennung erkennt Stimmungen und schlägt dementsprechend Lieder vor
Das menschliche Gesicht ist ein wichtiger Teil des Körpers einer Person, und es spielt vor allem eine bedeutende Rolle dabei, den Gemütszustand einer Person zu erkennen. Damit entfällt die langweilige und mühsame Aufgabe, Lieder manuell zu isolieren oder in verschiedene Datensätze zu gruppieren, und es hilft bei der Erstellung einer geeigneten Wiedergabeliste auf der Grundlage der emotionalen Merkmale einer Person.
Die Menschen neigen dazu, Musik auf der Grundlage ihrer Stimmung und Interessen zu hören. Durch die Erfassung von Gesichtsausdrücken kann eine Anwendung erstellt werden, die dem Benutzer je nach seiner Stimmung Lieder vorschlägt.
Computer Vision ist ein interdisziplinäres Gebiet, das Computern hilft, digitale Bilder oder Videos auf hohem Niveau zu verstehen. Computer Vision-Komponenten können verwendet werden, um die Emotionen des Benutzers durch Gesichtsausdrücke zu bestimmen.
Es gibt auch diese APIs, die ich interessant und nützlich fand, obwohl ich nicht an ihnen gearbeitet habe, aber ich füge sie hier an, in der Hoffnung, dass sie dir helfen werden.
Finden von bewohnbaren Exoplaneten anhand von Bildern, die von Raumfahrzeugen wie Kepler aufgenommen wurden
In den letzten zehn Jahren wurden mehr als eine Million Sterne beobachtet, um Transitplaneten zu identifizieren. Die manuelle Auswertung potenzieller Exoplaneten-Kandidaten ist arbeitsintensiv und anfällig für menschliche Fehler, deren Folgen schwer abzuschätzen sind. Faltungsneuronale Netze sind geeignet, erdähnliche Exoplaneten in verrauschten Zeitreihendaten mit höherer Präzision zu identifizieren als eine Least-Squares-Strategie.
Bildregenerierung für altes beschädigtes Rollenbild
Ich weiß, wie zeitaufwendig und schmerzhaft es ist, sein altes beschädigtes Foto in der ursprünglichen Form wiederzubekommen, wie es früher war. Dies kann mit Hilfe von Deep Learning geschehen, indem man alle Bilddefekte (Brüche, Schrammen, Löcher) findet, und mit Hilfe von Inpainting-Algorithmen kann man die Defekte anhand der Pixelwerte um sie herum leicht entdecken, um die alten Fotos wiederherzustellen und zu kolorieren.
Musikgenerierung mit Deep Learning
Musik ist eine Mischung aus Tönen verschiedener Frequenzen. Die automatische Musikgenerierung ist also ein Prozess, bei dem ein kurzes Musikstück mit möglichst wenig menschlicher Vermittlung komponiert wird. In jüngster Zeit hat sich die Deep-Learning-Technik als Wegbereiter für die programmierte Musikerzeugung erwiesen.
FINAL WORD
Ich weiß, dass es ein echter Kampf ist, ein cooles Data-Science-Portfolio aufzubauen. Aber mit dieser Sammlung, die ich oben zur Verfügung gestellt habe, können Sie überdurchschnittliche Fortschritte in diesem Bereich machen. Die Sammlung ist neu, was auch die Möglichkeit für Forschungszwecke bietet. Forscher im Bereich Data-Science können also auch diese Ideen auswählen, um daran zu arbeiten, so dass ihre Forschung eine große Hilfe für Data Scientists sein würde, um mit einem Projekt zu beginnen. Und außerdem macht es wirklich Spaß, die Seiten zu erforschen, die noch niemand zuvor gemacht hat.
Diese Sammlung besteht aus Ideen vom Anfänger bis zum Fortgeschrittenen.
So werde ich dies nicht nur für Neulinge im Bereich der Datenwissenschaft empfehlen, sondern auch für ältere Datenwissenschaftler. Es wird viele neue Wege in der Karriere eröffnen, nicht nur wegen der Projekte, sondern auch durch das neu gewonnene Netzwerk.
Diese Ideen zeigen dir die breite Palette an Möglichkeiten und geben dir die Ideen, um über den Tellerrand zu schauen.
Für mich und meine Freunde sind die Lernfaktoren, der Mehrwert für die Gesellschaft und das unerforschte Wissen wichtig und der Spaß ist in gewisser Weise essentiell. Im Grunde genommen mache ich also gerne solche Projekte, die uns die Möglichkeit geben, immenses Wissen zu erlangen und unerforschte Dimensionen zu erkunden. Das ist unser Hauptaugenmerk, wenn wir uns solchen Projekten widmen.