Di Kajal Yadav, scrittore freelance su scienza dei dati, startup & imprenditorialità.
Fonte Unsplash, a cura dell’autore.
Sei entusiasta di entrare nel mondo della Data Science? Congratulazioni! Questa è ancora la scelta giusta a causa della spinta finale nel bisogno di lavoro fatto in Data Science e Intelligenza Artificiale durante questa pandemia.
Anche se, a causa della crisi, il mercato attualmente diventa più duro per essere in grado di impostare di nuovo con più forza uomini come stanno facendo prima. Quindi, potrebbe essere possibile che devi prepararti mentalmente per il viaggio di assunzione a lungo termine e molti rifiuti lungo la strada.
Ecco, mentre scrivo questo articolo, sto assumendo che sai già che un portafoglio di scienza dei dati è fondamentale e come costruirlo.
Potresti passare la maggior parte del tuo tempo a fare data crunching e wrangling e non ad applicare modelli fantasiosi.
Una domanda che mi è stata posta più volte dagli appassionati di data science è che tipo di progetti dovrebbero includere nel loro portfolio per costruire un portfolio tremendamente buono e unico.
Di seguito do 8 idee uniche per il tuo portfolio di scienza dei dati con allegati articoli di riferimento da cui otterrai le intuizioni di come iniziare con ogni particolare idea.
- Analisi del sentimento per la depressione basata sui post dei social media
- Sports match video to text summarization using neural network
- Solutore di equazioni scritte a mano usando CNN
- Generazione di un riassunto di una riunione di lavoro usando NLP
- Riconoscimento facciale per rilevare l’umore e suggerire canzoni di conseguenza
- Scoprire esopianeti abitabili dalle immagini catturate da veicoli spaziali come Kepler
- Rigenerazione dell’immagine per una vecchia foto danneggiata della bobina
- Generazione di musica utilizzando l’apprendimento profondo
- PAROLA FINALE
Foto di dole777 su Unsplash.
Questo argomento è così sensibile da essere considerato oggi e in urgente necessità di fare qualcosa. Ci sono più di 264 milioni di individui nel mondo che soffrono di depressione. La depressione è la principale causa di disabilità in tutto il mondo ed è un sostenitore significativo del carico globale di malattia, e quasi 800.000 individui mordono costantemente la polvere a causa del suicidio ogni anno. Il suicidio è la seconda ragione di morte tra i 15-29enni. Il trattamento per la depressione è spesso ritardato, impreciso o mancato del tutto.
La vita basata su Internet dà la possibilità principale di cambiare i servizi di mediazione della malinconia precoce, soprattutto nei giovani adulti. In modo costante, circa 6.000 tweet sono twittati su Twitter, che si riferisce a più di 350.000 tweet inviati per ogni momento, 500 milioni di tweet per ogni giorno, e circa 200 miliardi di tweet per ogni anno.
Come indicato dal Pew Research Center, il 72% del pubblico utilizza una sorta di vita basata su internet. I set di dati rilasciati dalle reti sociali sono importanti per numerosi campi, per esempio, la scienza umana e la ricerca sul cervello. Ma i supporti da un punto di vista specialistico sono ben lungi dall’essere sufficienti, e le metodologie esplicite sono disperatamente sfortunate.
Analizzando i marcatori linguistici nei post dei social media, è possibile creare un modello di deep learning che può dare una visione individuale della sua salute mentale molto prima degli approcci tradizionali.
- You Are What You Tweet – Detecting Depression in Social Media via Twitter Usage
- Early Detection of Depression: Social Network Analysis and Random Forest Techniques – Original paper, University of A Coruna.
- Depression detection from social network data using machine learning techniques
Sports match video to text summarization using neural network
Photo by Aksh yadav on Unsplash.
So questa idea di progetto è fondamentalmente basata sull’ottenere una sintesi precisa dai video delle partite sportive. Ci sono siti web sportivi che raccontano gli highlights della partita. Diversi modelli sono stati proposti per il compito di riassunto estrattivo del testo, ma le reti neurali fanno il lavoro migliore. Di norma, il riassunto allude all’introduzione di informazioni in una struttura breve, concentrandosi sulle parti che trasmettono fatti e informazioni, salvaguardando l’importanza.
La creazione automatica di un riassunto di un video di una partita dà luogo alla sfida di distinguere i minuti affascinanti o gli highlights di una partita.
Così, si può raggiungere questo obiettivo utilizzando alcune tecniche di apprendimento profondo come 3D-CNN (reti convoluzionali tridimensionali), RNN (rete neurale ricorrente), LSTM (reti di memoria a breve termine lunga), e anche attraverso algoritmi di apprendimento automatico dividendo il video in diverse sezioni e poi applicando SVM (Support vector machines), NN (reti neurali), e k-means algoritmi.
Per una migliore comprensione, fare riferimento all’articolo allegato in dettaglio.
- Classificazione delle scene per la sintesi di video sportivi utilizzando l’apprendimento di trasferimento – Questo articolo propone un nuovo metodo per la classificazione delle scene dei video sportivi.
Solutore di equazioni scritte a mano usando CNN
Foto di Antoine Dautry su Unsplash.
Tra tutti i problemi, il riconoscimento di espressioni matematiche scritte a mano è uno dei problemi che confondono nella regione della ricerca sulla computer vision. È possibile addestrare un risolutore di equazioni scritte a mano da cifre scritte a mano e simboli matematici utilizzando la Rete Neurale Convoluzionale (CNN) con alcune tecniche di elaborazione delle immagini. Lo sviluppo di un tale sistema richiede l’addestramento delle nostre macchine con i dati, rendendole abili ad apprendere e a fare la previsione richiesta.
Fate riferimento agli articoli sotto allegati per una migliore comprensione.
- Solutore di equazioni scritte a mano usando la Rete Neurale Convoluzionale
- vipul79321/Handwritten-Equation-Solver – Un risolutore di equazioni scritte a mano usando CNN L’equazione può contenere qualsiasi cifra da 0-9 e simbolo.
- Computer Vision – Auto grading Handwritten Mathematical Answer sheets – Digitalizzazione dei passi di risoluzione di un’equazione matematica scritta a mano libera su un foglio.
- Equazioni scritte a mano in LaTeX
Generazione di un riassunto di una riunione di lavoro usando NLP
Foto di Sebastian Herrmann su Unsplash.
Si è mai trovato in una situazione in cui tutti vogliono vedere un riassunto e non la relazione completa? Beh, l’ho affrontato durante i miei giorni di scuola e di università, dove abbiamo speso un sacco di tempo per preparare un intero rapporto, ma l’insegnante ha solo il tempo di leggere il riassunto.
La sintesi è sorta come un modo inesorabilmente utile per affrontare il problema del sovraccarico di dati. Estrarre informazioni dalle conversazioni può avere un ottimo valore commerciale ed educativo. Questo può essere fatto tramite la cattura degli aspetti statistici, linguistici e sentimentali con la struttura di dialogo della conversazione.
Modificare manualmente la relazione in una forma riassuntiva richiede troppo tempo, non è così? Ma ci si può affidare alle tecniche di Natural Language Processing (NLP) per ottenere ciò.
Il riassunto del testo utilizzando l’apprendimento profondo può comprendere il contesto dell’intero testo. Non è un sogno che si avvera per tutti noi che abbiamo bisogno di un rapido riassunto di un documento!
Fate riferimento agli articoli sotto allegati per una migliore comprensione.
- Guida completa alla sintesi del testo usando il Deep Learning in Python – “Non voglio un rapporto completo, datemi solo un riassunto dei risultati.”
- Capire la sintesi del testo e creare il tuo riassunto in python – La sintesi può essere definita come il compito di produrre un riassunto conciso e fluente preservando le informazioni chiave.
Riconoscimento facciale per rilevare l’umore e suggerire canzoni di conseguenza
Foto di Alireza Attari su Unsplash.
Il volto umano è una parte importante del corpo di un individuo, e in particolare gioca un ruolo significativo nel conoscere lo stato d’animo di una persona. Questo elimina il compito noioso e tedioso di isolare o raggruppare manualmente le canzoni in vari dischi e aiuta a generare una playlist appropriata basata sulle caratteristiche emotive di un individuo.
Le persone tendono ad ascoltare la musica in base al loro umore e interessi. Si può creare un’applicazione per suggerire canzoni agli utenti in base al loro umore catturando le espressioni facciali.
La computer vision è un campo interdisciplinare che aiuta a trasmettere ai computer una comprensione di alto livello di immagini digitali o video. I componenti di computer vision possono essere utilizzati per determinare l’emozione dell’utente attraverso le espressioni facciali.
Ci sono anche queste API, che ho trovato interessanti e utili. Tuttavia, non ho lavorato su questi, ma li allego qui con la speranza che questi vi aiutino.
- 20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned | Nordic APIs – Se le aziende potessero percepire le emozioni usando la tecnologia in ogni momento, potrebbero capitalizzare su di essa per vendere al consumatore.
Scoprire esopianeti abitabili dalle immagini catturate da veicoli spaziali come Kepler
Foto di Nick Owuor (astro.nic.visuals) su Unsplash.
Nel decennio più recente, oltre un milione di stelle sono state monitorate per identificare pianeti in transito. L’interpretazione manuale dei potenziali candidati esopianeti è laboriosa e soggetta all’errore umano, le cui conseguenze sono difficili da valutare. Le reti neurali convoluzionali sono adatte a identificare esopianeti simili alla Terra in dati di serie temporali rumorosi con una precisione più spiccata rispetto a una strategia dei minimi quadrati.
- Caccia all’esopianeta usando il Machine Learning – A caccia di mondi oltre il nostro sistema solare.
- Intelligenza artificiale, dati NASA usati per scoprire l’esopianeta – Il nostro sistema solare ora è legato per il maggior numero di pianeti intorno ad una singola stella.
Rigenerazione dell’immagine per una vecchia foto danneggiata della bobina
Fonte Pikist.
So quanto tempo e dolore sia necessario per recuperare la tua vecchia foto danneggiata nella forma originale come era prima. Quindi, questo può essere fatto utilizzando l’apprendimento profondo trovando tutti i difetti dell’immagine (fratture, graffi, buchi), e utilizzando algoritmi di inpainting, in modo che si possa facilmente scoprire i difetti in base ai valori dei pixel intorno ad essi per ripristinare e colorare le vecchie foto.
- Colorare e ripristinare le vecchie immagini con il Deep Learning – Colorare le immagini in bianco e nero con il deep learning è diventata una vetrina impressionante per l’applicazione nel mondo reale.
- Guida al Image Inpainting: Utilizzando l’apprendimento automatico per modificare e correggere i difetti nelle foto
- Come eseguire il restauro delle immagini assolutamente DataSet Free
Generazione di musica utilizzando l’apprendimento profondo
Foto di Abigail Keenan su Unsplash.
La musica è un assortimento di toni di varie frequenze. Quindi, la generazione automatica di musica è un processo di composizione di un breve pezzo di musica con la minima mediazione umana. Recentemente, l’ingegneria del deep learning è diventata la punta di diamante per la generazione di musica programmata.
- Generazione di musica usando il Deep Learning
- Come generare musica usando una rete neurale LSTM in Keras – Un’introduzione alla creazione di musica usando le reti neurali LSTM
PAROLA FINALE
So che è una vera lotta per costruire un bel portfolio di data science. Ma con una collezione come quella che ho fornito sopra, puoi fare progressi superiori alla media in quel campo. La collezione è nuova, il che dà l’opportunità anche per scopi di ricerca. Quindi, i ricercatori in Data Science possono anche scegliere queste idee su cui lavorare in modo che la loro ricerca sarebbe un grande aiuto per i Data Scientist per iniziare con il progetto. Inoltre, è divertente esplorare i lati che nessuno ha fatto prima. Anche se, questa raccolta in realtà costituisce idee dall’inizio ai livelli avanzati.
Quindi, non lo raccomando solo ai neofiti nell’area della scienza dei dati ma anche agli scienziati dei dati senior. Aprirà molte nuove strade durante la vostra carriera, non solo a causa dei progetti ma anche attraverso la rete appena acquisita.
Queste idee vi mostrano la vasta gamma di possibilità e vi danno le idee per pensare fuori dagli schemi.
Per me e i miei amici, i fattori di apprendimento, il valore aggiunto alla società, e la conoscenza inesplorata è importante, e il divertimento in un certo senso è essenziale. Quindi, fondamentalmente, mi piace fare questi progetti che ci danno modo di acquisire un’immensa conoscenza in un certo senso e ci permettono di esplorare le dimensioni inesplorate. Questo è il nostro obiettivo principale quando dedichiamo tempo a tali progetti.
Originale. Ripostata con permesso.
Bio: Kajal Yadav è una scrittrice freelance specializzata in data science, startup e imprenditoria. Scrive per diverse pubblicazioni e allo stesso tempo lavora con le startup sulle loro strategie di content marketing.
Related:
- Start Your Machine Learning Career in Quarantine
- Projects to Include in a Data Science Portfolio
- How to Build a Data Science Portfolio