By Kajal Yadav, freelance writer on data science, startups & entrepreneurship.
Source Unsplash, edited by the author.
Czy jesteś podekscytowany wejściem w świat Data Science? Gratulacje! To wciąż właściwy wybór ze względu na ostateczny impuls w potrzebie pracy w Data Science i sztucznej inteligencji podczas tego pandemic.
Although, z powodu kryzysu, rynek obecnie staje się trudniejsze, aby być w stanie ustawić go ponownie z więcej mężczyzn siły, jak robią wcześniej. Tak, To może być możliwe, że trzeba przygotować się psychicznie do długiej podróży zatrudniania run i wiele odrzuceń po drodze.
Hereby, pisząc ten artykuł, jestem zakładając, że już wiesz, że portfolio nauki danych jest kluczowe i jak go zbudować.
Możesz spędzić większość swojego czasu na analizowaniu danych i ich przetwarzaniu, a nie na stosowaniu wymyślnych modeli.
Jednym z pytań, które zadawałem entuzjastom nauki o danych, jest pytanie o to, jakiego rodzaju projekty powinni zawrzeć w swoim portfolio, aby zbudować niesamowicie dobre i unikalne portfolio.
Poniżej przedstawiam 8 unikalnych pomysłów na portfolio nauki o danych z załączonymi artykułami referencyjnymi, z których można uzyskać wgląd w to, jak zacząć z każdym konkretnym pomysłem.
- Analiza nastrojów dla depresji w oparciu o posty w mediach społecznościowych
- Sports match video to text summarization using neural network
- Handwritten equation solver using CNN
- Generowanie podsumowania spotkania biznesowego przy użyciu NLP
- Rozpoznawanie twarzy w celu wykrycia nastroju i odpowiedniego zasugerowania piosenek
- Odnalezienie nadających się do zamieszkania egzoplanet na podstawie obrazów przechwyconych przez pojazdy kosmiczne takie jak Kepler
- Image regeneration for old damaged reel picture
- Music generation using deep learning
- Słowo końcowe
Analiza nastrojów dla depresji w oparciu o posty w mediach społecznościowych
Photo by dole777 on Unsplash.
Ten temat jest tak wrażliwy, aby być uważanym w dzisiejszych czasach i w pilnej potrzebie, aby coś z tym zrobić. Na całym świecie ponad 264 miliony osób cierpi na depresję. Depresja jest główną przyczyną niepełnosprawności na całym świecie i w znacznym stopniu przyczynia się do ogólnego globalnego obciążenia chorobami, a prawie 800 000 osób rocznie konsekwentnie zapada na zdrowiu z powodu samobójstwa. Samobójstwo jest drugą najczęstszą przyczyną śmierci osób w wieku 15-29 lat. Leczenie depresji jest często opóźnione, nieprecyzyjne, lub całkowicie pomijane.
Internetowe życie daje główną szansę na zmianę wczesnych usług mediacji melancholii, zwłaszcza u młodych dorosłych. Konsekwentnie, w przybliżeniu 6,000 tweetów na Twitterze, co odnosi się do ponad 350,000 tweetów wysłanych w każdej chwili, 500 milionów tweetów każdego dnia i około 200 miliardów tweetów każdego roku.
Jak wskazuje Pew Research Center, 72% społeczeństwa korzysta z jakiegoś rodzaju życia opartego na Internecie. Zbiory danych uzyskane z sieci społecznych są ważne dla wielu dziedzin, na przykład nauki o człowieku i badań mózgu. Ale wsparcie z wyspecjalizowanego punktu widzenia jest dalekie od wystarczającego, a jednoznaczne metodologie są rozpaczliwie pozbawione szczęścia.
Analizując znaczniki językowe w postach mediów społecznościowych, można stworzyć model głębokiego uczenia, który może dać jednostce wgląd w jej zdrowie psychiczne znacznie wcześniej niż tradycyjne podejścia.
- You Are What You Tweet – Detecting Depression in Social Media via Twitter Usage
- Early Detection of Depression: Social Network Analysis and Random Forest Techniques – Oryginalny papier, University of A Coruna.
- Depression detection from social network data using machine learning techniques
Sports match video to text summarization using neural network
Photo by Aksh yadav on Unsplash.
Więc ten pomysł na projekt jest w zasadzie oparty na uzyskaniu dokładnego streszczenia z wideo meczów sportowych. Istnieją strony sportowe, które opowiadają o najważniejszych momentach meczu. Różne modele zostały zaproponowane dla zadania ekstrakcji streszczenia tekstu, ale sieci neuronowe zrobić najlepszą pracę. Co do zasady, podsumowanie odnosi się do wprowadzenia informacji w krótkiej strukturze, koncentrując się na częściach, które przekazują fakty i informacje, przy jednoczesnym zachowaniu znaczenia.
Automatyczne tworzenie zarysu wideo meczu rodzi wyzwanie wyróżnienia fascynujących minut lub najważniejszych momentów meczu.
Więc, można to osiągnąć za pomocą niektórych technik głębokiego uczenia się, takich jak 3D-CNN (trójwymiarowe sieci konwolucyjne), RNN (sieć neuronowa rekurencyjna), LSTM (sieci pamięci długotrwałej krótkotrwałej), a także za pomocą algorytmów uczenia maszynowego, dzieląc wideo na różne sekcje, a następnie stosując algorytmy SVM (maszyny wektorów nośnych), NN (sieci neuronowe) i k-średnich.
Dla lepszego zrozumienia, proszę odnieść się szczegółowo do załączonego artykułu.
- Scene Classification for Sports Video Summarization Using Transfer Learning – Niniejszy artykuł proponuje nową metodę klasyfikacji scen wideo o tematyce sportowej.
Handwritten equation solver using CNN
Photo by Antoine Dautry on Unsplash.
Pomiędzy wszystkimi zagadnieniami, rozpoznawanie odręcznego pisma matematycznego jest jednym z zagmatwanych problemów w regionie badań nad widzeniem komputerowym. Można wytrenować program do rozwiązywania równań na podstawie odręcznie pisanych cyfr i symboli matematycznych, używając sieci neuronowych (CNN) z pewnymi technikami przetwarzania obrazu. Stworzenie takiego systemu wymaga szkolenia naszych maszyn z danymi, co czyni je biegłymi w uczeniu się i dokonywaniu wymaganych przewidywań.
Dla lepszego zrozumienia proszę odnieść się do poniżej załączonych artykułów.
- Handwritten Equation Solver using Convolutional Neural Network
- vipul79321/Handwritten-Equation-Solver – An Handwritten Equation solver using CNN Równanie może zawierać dowolną cyfrę od 0-9 i symbol.
- Computer Vision – Automatyczne ocenianie ręcznie pisanych arkuszy z odpowiedziami matematycznymi – Digitalizacja kroków rozwiązywania równania matematycznego napisanego odręcznie na papierze.
- Równania pisane ręcznie do LaTeX
Generowanie podsumowania spotkania biznesowego przy użyciu NLP
Zdjęcie autorstwa Sebastiana Herrmanna na Unsplash.
Czy kiedykolwiek utknąłeś w sytuacji, w której wszyscy chcą zobaczyć podsumowanie, a nie pełny raport? Cóż, spotkałem się z tym w czasach szkolnych i studenckich, kiedy spędzaliśmy mnóstwo czasu na przygotowaniu całego raportu, ale nauczyciel miał czas tylko na przeczytanie streszczenia.
Summatyzacja stała się nieubłaganie pomocnym sposobem radzenia sobie z problemem nadmiaru danych. Wydobywanie informacji z rozmów może mieć bardzo dobrą wartość komercyjną i edukacyjną. Można to zrobić poprzez przechwytywanie cech statystycznych, językowych i sentymentalnych aspektów wraz ze strukturą dialogową rozmowy.
Ręczna zmiana raportu do postaci podsumowującej jest zbyt czasochłonna, nieprawdaż? Ale można polegać na technikach przetwarzania języka naturalnego (NLP), aby to osiągnąć.
Sumowanie tekstu przy użyciu głębokiego uczenia się może zrozumieć kontekst całego tekstu. Czyż nie jest to spełnienie marzeń wszystkich z nas, którzy muszą wymyślić szybkie streszczenie dokumentu!
Do lepszego zrozumienia odnieś się do poniżej załączonych artykułów.
- Comprehensive Guide to Text Summarization using Deep Learning in Python – „Nie chcę pełnego raportu, daj mi tylko podsumowanie wyników.”
- Understand Text Summarization and create your own summarizer in python – Summatyzację można zdefiniować jako zadanie polegające na stworzeniu zwięzłego i płynnego podsumowania z zachowaniem kluczowych informacji.
Rozpoznawanie twarzy w celu wykrycia nastroju i odpowiedniego zasugerowania piosenek
Photo by Alireza Attari on Unsplash.
Ludzka twarz jest ważną częścią ciała jednostki, a w szczególności odgrywa istotną rolę w poznawaniu stanu umysłu danej osoby. Eliminuje to ponure i żmudne zadanie ręcznego wyodrębniania lub grupowania utworów w różne rekordy i pomaga w generowaniu odpowiedniej listy odtwarzania w oparciu o indywidualne cechy emocjonalne.
Ludzie mają tendencję do słuchania muzyki w oparciu o ich nastrój i zainteresowania. Można stworzyć aplikację sugerującą utwory dla użytkowników na podstawie ich nastroju poprzez przechwytywanie wyrazu twarzy.
Wizja komputerowa jest dziedziną interdyscyplinarną, która pomaga przekazać komputerom wysokopoziomowe zrozumienie obrazów cyfrowych lub filmów. Komponenty wizji komputerowej mogą być używane do określania emocji użytkownika poprzez mimikę twarzy.
Istnieją również te interfejsy API, które uznałem za interesujące i przydatne. Jednak nie pracowałem nad nimi, ale załączam je tutaj z nadzieją, że ci pomogą.
- 20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned | Nordic APIs – Jeśli firmy mogłyby wyczuwać emocje za pomocą technologii przez cały czas, mogłyby wykorzystać je do sprzedaży konsumentom.
Odnalezienie nadających się do zamieszkania egzoplanet na podstawie obrazów przechwyconych przez pojazdy kosmiczne takie jak Kepler
Zdjęcie autorstwa Nicka Owuora (astro.nic.visuals) na Unsplash.
W ostatniej dekadzie ponad milion gwiazd było monitorowanych w celu identyfikacji planet tranzytowych. Ręczna interpretacja potencjalnych kandydatów na egzoplanety jest pracochłonna i narażona na błędy ludzkie, których konsekwencje są trudne do oszacowania. Konwolucyjne sieci neuronowe nadają się do identyfikacji podobnych do Ziemi egzoplanet w zaszumionych danych szeregu czasowego z większą precyzją niż strategia najmniejszych kwadratów.
- Polowanie na egzoplanety z wykorzystaniem uczenia maszynowego – Polowanie na światy poza naszym Układem Słonecznym.
- Artificial Intelligence, NASA Data Used to Discover Exoplanet – Our solar system now is tied for most number of planet around a single star.
Image regeneration for old damaged reel picture
Source Pikist.
Wiem, jak czasochłonne i bolesne jest odzyskanie starego, zniszczonego zdjęcia w oryginalnej formie, w jakiej było wcześniej. Tak więc, można to zrobić za pomocą głębokiego uczenia się poprzez znalezienie wszystkich wad obrazu (pęknięcia, otarcia, dziury) i zastosowanie algorytmów inpaintingu, dzięki czemu można łatwo odkryć wady na podstawie wartości pikseli wokół nich, aby przywrócić i pokolorować stare zdjęcia.
- Colorizing and Restoring Old Images with Deep Learning – Colorizing black and white images with deep learning has become an impressive showcase for the real-world application.
- Guide to Image Inpainting: Using machine learning to edit and correct defects in photos
- How To Perform Image Restoration Absolutely DataSet Free
Music generation using deep learning
Photo by Abigail Keenan on Unsplash.
Music is an assortment of tones of various frequencies. Tak więc, automatyczne generowanie muzyki jest procesem komponowania krótkiego utworu muzycznego przy jak najmniejszym udziale człowieka. Ostatnio, inżynieria głębokiego uczenia stała się krawędzią tnącą dla programowanego generowania muzyki.
- Generowanie muzyki przy użyciu Deep Learning
- Jak generować muzykę przy użyciu sieci neuronowej LSTM w Keras – Wprowadzenie do tworzenia muzyki przy użyciu sieci neuronowych LSTM
Słowo końcowe
Wiem, że zbudowanie fajnego portfolio data science to prawdziwa walka. Ale z taką kolekcją, jaką udostępniłem powyżej, można zrobić ponadprzeciętny postęp w tej dziedzinie. Kolekcja jest nowa, co daje możliwość również do celów badawczych. Tak więc, naukowcy w Data Science mogą również wybrać te pomysły do pracy, aby ich badania były świetną pomocą dla Data Scientists, aby rozpocząć projekt. Co więcej, fajnie jest odkrywać strony, których nikt wcześniej nie robił. Chociaż, ta kolekcja faktycznie stanowi pomysły od początku do zaawansowanych poziomów.
Więc, nie tylko polecam to dla początkujących w dziedzinie nauki o danych, ale także starszych naukowców danych. Otworzy to wiele nowych ścieżek w twojej karierze, nie tylko dzięki projektom, ale także dzięki nowo zdobytej sieci kontaktów.
Pomysły te pokazują szeroki zakres możliwości i dają ci pomysły na nieszablonowe myślenie.
Dla mnie i moich przyjaciół ważne są czynniki związane z uczeniem się, dodawaniem wartości do społeczeństwa i niezbadaną wiedzą, a zabawa jest w pewnym sensie niezbędna. Tak więc, zasadniczo, lubię robić takie projekty, które dają nam możliwość zdobycia ogromnej wiedzy i pozwalają nam odkrywać niezbadane wymiary. To jest nasz główny cel, kiedy poświęcamy czas na takie projekty.
Original. Reposted with permission.
Bio: Kajal Yadav jest pisarzem freelancerem specjalizującym się w nauce o danych, startupach i przedsiębiorczości. Pisze dla kilku publikacji i jednocześnie współpracuje ze startupami nad ich strategiami content marketingowymi.
Related:
- Start Your Machine Learning Career in Quarantine
- Projects to Include in a Data Science Portfolio
- How to Build a Data Science Portfolio
.