Door Kajal Yadav, een freelance schrijver over data science, startups & ondernemerschap.
Bron Unsplash, bewerkt door de auteur.
Ben je enthousiast om de Data Science-wereld te betreden? Congrats! Dat is nog steeds de juiste keuze vanwege de ultieme boost in de behoefte aan werk gedaan in Data Science en Artificial Intelligence tijdens deze pandemie.
Hoewel, als gevolg van de crisis, de markt op dit moment wordt harder om te kunnen om het weer op te zetten met meer mannen kracht als ze eerder doen. Dus, Het zou kunnen dat je jezelf mentaal voor te bereiden op de lange termijn het inhuren van reis en vele afwijzingen in langs de way.
Hierbij, terwijl het schrijven van dit artikel, Ik ga ervan uit dat je al weet dat een data science portfolio is van cruciaal belang en hoe je het op te bouwen.
Je besteedt misschien het grootste deel van je tijd aan het crunchen en wranglen van gegevens en niet aan het toepassen van fancy modellen.
Een vraag die ik keer op keer heb gesteld door data science-enthousiastelingen is dat wat voor soort projecten ze in hun portfolio moeten opnemen om een enorm goed en uniek portfolio op te bouwen.
Hieronder geef ik 8 unieke ideeën voor je data science portfolio met bijgevoegde referentie-artikelen van waaruit je de inzichten krijgt van hoe je aan de slag kunt gaan met elk bepaald idee.
- Sentimentanalyse voor depressie op basis van social media posts
- Sports match video to text summarization using neural network
- Handgeschreven vergelijkingsoplosser met behulp van CNN
- Samenvatting van een zakelijke vergadering genereren met behulp van NLP
- Gezichtsherkenning om stemming te detecteren en dienovereenkomstig liedjes voor te stellen
- Het vinden van een bewoonbare exoplaneet uit beelden die zijn vastgelegd door ruimtevaartuigen zoals Kepler
- Image regeneration for old damaged reel picture
- Music generation using deep learning
- FINAL WORD
Foto door dole777 op Unsplash.
Dit onderwerp is tegenwoordig zo gevoelig om te worden overwogen en in dringende noodzaak om er iets aan te doen. Wereldwijd zijn er meer dan 264 miljoen mensen die aan depressies lijden. Depressie is de belangrijkste oorzaak van invaliditeit wereldwijd en is een belangrijke ondersteuner van de totale mondiale ziektelast, en bijna 800.000 personen bijten consequent in het stof door zelfmoord elk jaar. Zelfmoord is de tweede doodsoorzaak onder 15- tot 29-jarigen. Behandeling voor depressie wordt vaak vertraagd, onnauwkeurig, of helemaal gemist.
Internet-gebaseerd leven geeft de belangrijkste randkans om vroegtijdige melancholiebemiddelingsdiensten te veranderen, vooral in jeugdige volwassenen. Consequent, ruwweg 6.000 Tweets worden getweet op Twitter, wat betrekking heeft op meer dan 350.000 tweets verzonden voor elk moment, 500 miljoen tweets voor elke dag, en ongeveer 200 miljard tweets voor elk jaar.
Zoals aangegeven door het Pew Research Center, gebruikt 72% van het publiek een soort van internetgebaseerd leven. Datasets die vrijkomen uit sociale netwerken zijn belangrijk voor tal van gebieden, bijvoorbeeld menswetenschappen en hersenonderzoek. Maar de ondersteuning vanuit een gespecialiseerd oogpunt is bij lange na niet genoeg, en expliciete methodologieën zijn hopeloos kansloos.
Door linguïstische markers in sociale-mediaposts te analyseren, is het mogelijk om een deep learning-model te creëren dat een individu veel eerder inzicht kan geven in zijn of haar geestelijke gezondheid dan traditionele benaderingen.
- You Are What You Tweet – Detecting Depression in Social Media via Twitter Usage
- Early Detection of Depression: Social Network Analysis and Random Forest Techniques – Original paper, University of A Coruna.
- Depression detection from social network data using machine learning techniques
Sports match video to text summarization using neural network
Photo by Aksh yadav on Unsplash.
Dit projectidee is dus eigenlijk gebaseerd op het verkrijgen van een precieze samenvatting uit video’s van sportwedstrijden. Er zijn sport websites die vertellen over hoogtepunten van de wedstrijd. Verschillende modellen zijn voorgesteld voor de taak van extractieve tekstsamenvatting, maar neurale netwerken doen het het beste. In de regel zinspeelt samenvatten op het introduceren van informatie in een korte structuur, waarbij men zich concentreert op delen die feiten en informatie overbrengen, zonder het belang uit het oog te verliezen.
Het automatisch maken van een samenvatting van een wedstrijdvideo leidt tot de uitdaging om fascinerende minuten of hoogtepunten van een wedstrijd te onderscheiden.
Dus, men kan dat bereiken met behulp van sommige deep learning technieken zoals 3D-CNN (driedimensionale convolutionele netwerken), RNN (Recurrent neural network), LSTM (Long short term memory networks), en ook door middel van machine learning algoritmen door de video in verschillende secties te verdelen en vervolgens SVM (Support vector machines), NN (Neural Networks), en k-means algoritmen toe te passen.
Voor een beter begrip, raadpleeg het bijgevoegde artikel in detail.
- Scène-indeling voor sportvideo-samenvatting met behulp van transferleren – In dit artikel wordt een nieuwe methode voor scène-indeling van sportvideo’s voorgesteld.
Handgeschreven vergelijkingsoplosser met behulp van CNN
Foto door Antoine Dautry op Unsplash.
Herkenning van handgeschreven wiskundige uitdrukkingen is één van de meest verwarrende problemen in het gebied van computervisie-onderzoek. Je kunt een handgeschreven vergelijkingsoplosser trainen door handgeschreven cijfers en wiskundige symbolen te gebruiken met behulp van Convolutional Neural Network (CNN) met enkele beeldverwerkingstechnieken. Het ontwikkelen van een dergelijk systeem vereist het trainen van onze machines met gegevens, waardoor het bedreven in het leren en het maken van de vereiste voorspelling.
Raadpleeg de hieronder bijgevoegde artikelen voor een beter begrip.
- Handgeschreven vergelijking oplosser met behulp van Convolutional Neural Network
- vipul79321/Handwritten-Equation-Solver – Een handgeschreven vergelijking solver met behulp van CNN Vergelijking kan elk cijfer van 0-9 en symbool bevatten.
- Computer Vision – Auto grading Handgeschreven wiskundige antwoordbladen – Digitaliseren van de stappen van het oplossen van een wiskundige vergelijking geschreven met de vrije hand op een papier.
- Handgeschreven vergelijkingen naar LaTeX
Samenvatting van een zakelijke vergadering genereren met behulp van NLP
Foto door Sebastian Herrmann op Unsplash.
Ergens vastgelopen in een situatie waarin iedereen een samenvatting wil zien en niet het volledige verslag? Nou, ik heb ermee te maken gehad tijdens mijn school- en collegeperiode, waar we veel tijd besteedden aan het voorbereiden van een heel verslag, maar de leraar alleen tijd had om de samenvatting te lezen.
Samenvatten is opgekomen als een onverbiddelijk nuttige manier om het probleem van de gegevensoverbelasting aan te pakken. Het extraheren van informatie uit gesprekken kan van zeer goede commerciële en educatieve waarde zijn. Dit kan worden gedaan door het vastleggen van de statistische, linguïstische en sentimentele aspecten met de dialoogstructuur van het gesprek.
Het handmatig veranderen van het verslag in een samengevatte vorm is te tijdrovend, nietwaar? Maar men kan vertrouwen op Natural Language Processing (NLP) technieken om dat te bereiken.
Tekstsamenvatting met behulp van deep learning kan de context van de hele tekst begrijpen. Is het niet een droom die uitkomt voor ons allemaal die een snelle samenvatting van een document moeten maken!
Raadpleeg de onderstaande bijgevoegde artikelen voor een beter begrip.
- Comprehensive Guide to Text Summarization using Deep Learning in Python – “Ik wil geen volledig rapport, geef me gewoon een samenvatting van de resultaten.”
- Begrijp Text Summarization en maak je eigen summarizer in python – Summarization kan worden gedefinieerd als een taak om een beknopte en vloeiende samenvatting te produceren met behoud van belangrijke informatie.
Gezichtsherkenning om stemming te detecteren en dienovereenkomstig liedjes voor te stellen
>
Foto door Alireza Attari op Unsplash.
Het menselijk gezicht is een belangrijk onderdeel van het lichaam van een individu, en het speelt met name een belangrijke rol bij het kennen van de gemoedstoestand van een persoon. Dit elimineert de saaie en vervelende taak van het handmatig isoleren of groeperen van liedjes in verschillende platen en helpt bij het genereren van een geschikte afspeellijst op basis van de emotionele kenmerken van een individu.
Mensen hebben de neiging om naar muziek te luisteren op basis van hun stemming en interesses. Men kan een toepassing creëren om gebruikers liedjes voor te stellen op basis van hun stemming door gezichtsuitdrukkingen vast te leggen.
Computer vision is een interdisciplinair gebied dat helpt om een hoog niveau van begrip van digitale beelden of video’s over te brengen op computers. Computer vision componenten kunnen worden gebruikt om de emotie van de gebruiker te bepalen door middel van gezichtsuitdrukkingen.
Er zijn ook deze API’s, die ik interessant en nuttig vond. Ik heb er echter niet aan gewerkt, maar ze hier bijgevoegd in de hoop dat ze je zullen helpen.
- 20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned | Nordic APIs – Als bedrijven emoties te allen tijde met behulp van technologie zouden kunnen waarnemen, zouden ze er munt uit kunnen slaan om aan de consument te verkopen.
Het vinden van een bewoonbare exoplaneet uit beelden die zijn vastgelegd door ruimtevaartuigen zoals Kepler
Foto door Nick Owuor (astro.nic.visuals) op Unsplash.
In het meest recente decennium zijn meer dan een miljoen sterren in de gaten gehouden om doortrekkende planeten te identificeren. Handmatige interpretatie van potentiële exoplaneetkandidaten is arbeidsintensief en onderhevig aan menselijke fouten, waarvan de gevolgen moeilijk te evalueren zijn. Convolutionele neurale netwerken zijn geschikt voor het identificeren van aardachtige exoplaneten in ruisige tijdreeksgegevens met een grotere precisie dan een kleinste-kwadratenstrategie.
- Exoplanetenjacht met behulp van Machine Learning – Jacht op werelden buiten ons zonnestelsel.
- Artificial Intelligence, NASA Data Used to Discover Exoplanet – Ons zonnestelsel staat nu gelijk voor meeste aantal planeten rond één ster.
Image regeneration for old damaged reel picture
Source Pikist.
Ik weet hoe tijdrovend en pijnlijk het is om je oude beschadigde foto terug te krijgen in de originele vorm zoals die eerder was. Dus, dit kan worden gedaan met behulp van deep learning door het vinden van alle beelddefecten (breuken, slijtplekken, gaten), en het gebruik van inpainting-algoritmen, zodat men gemakkelijk de defecten kan ontdekken op basis van de pixelwaarden eromheen om de oude foto’s te herstellen en te kleuren.
- Colorizing and Restoring Old Images with Deep Learning – Colorizing black and white images with deep learning is een indrukwekkende showcase geworden voor de toepassing in de echte wereld.
- Guide to Image Inpainting: Using machine learning to edit and correct defects in photos
- How To Perform Image Restoration Absolutely DataSet Free
Music generation using deep learning
Photo by Abigail Keenan on Unsplash.
Music is een assortiment van tonen van verschillende frequenties. Automatische muziekgeneratie is dus een proces om een kort muziekstuk te componeren met zo min mogelijk menselijke tussenkomst. Onlangs is deep learning-engineering de speerpunt geworden voor geprogrammeerde muziekgeneratie.
- Muziekgeneratie met behulp van Deep Learning
- Hoe muziek genereren met behulp van een LSTM-neuraal netwerk in Keras – Een inleiding tot het maken van muziek met behulp van LSTM-neurale netwerken
FINAL WORD
Ik weet dat het een echte strijd is om een cool data science-portfolio op te bouwen. Maar met zo’n verzameling die ik hierboven heb gegeven, kun je op dat gebied bovengemiddelde vooruitgang boeken. De collectie is nieuw, wat ook de mogelijkheid geeft voor onderzoeksdoeleinden. Dus, onderzoekers in Data Science kunnen ook deze ideeën kiezen om aan te werken, zodat hun onderzoek een grote hulp zou zijn voor Data Scientists om met het project te beginnen. Bovendien is het leuk om de kanten te verkennen die nog niemand eerder heeft gedaan. Hoewel, deze collectie vormt eigenlijk ideeën van beginnend tot gevorderd niveau.
Dus, ik zal dit niet alleen aanraden voor nieuwelingen op het gebied van data science, maar ook voor senior data scientists. Het zal veel nieuwe paden openen tijdens je carrière, niet alleen vanwege de projecten, maar ook door het nieuw opgedane netwerk.
Deze ideeën laten je het brede scala aan mogelijkheden zien en geven je de ideeën om out of the box te denken.
Voor mij en mijn vrienden zijn de leerfactoren, het toevoegen van waarde aan de samenleving, en de onontgonnen kennis belangrijk, en het plezier in zekere zin is essentieel. Dus, in principe, geniet ik ervan om zulke projecten te doen die ons een manier geven om immense kennis op te doen en ons de onontdekte dimensies te laten verkennen. Dat is onze belangrijkste focus wanneer we tijd besteden aan dergelijke projecten.
Original. Herplaatst met toestemming.
Bio: Kajal Yadav is een freelance schrijver die gespecialiseerd is in data science, startups en ondernemerschap. Ze schrijft voor verschillende publicaties en werkt tegelijkertijd met startups aan hun contentmarketingstrategieën.
Gerelateerd:
- Start je Machine Learning-carrière in Quarantaine
- Projecten om op te nemen in een Data Science Portfolio
- Hoe bouw je een Data Science Portfolio