Was ist der Unterschied zwischen Informatik und Datenwissenschaft?


Antwort 1:

Informatik im Sinne des statistischen Rechnens ist das Studium von Informationen (jeglicher Art) unter Verwendung von Algorithmen, die mathematischer und statistischer Natur sind. Es wird in diesem Sinne nicht wirklich als Wort verwendet - das nächste, was ich mir vorstellen kann, ist die Bioinformatik. Der üblichere Name dafür ist Lerntheorie.

Informatik ist in der Informatik das theoretische Studium von Informationen, Algorithmen und Computern.

Offensichtlich sind beide wichtig, um sie bei jeder Anwendung der Datenwissenschaft zu berücksichtigen, die noch ziemlich schlecht definiert ist, aber im Allgemeinen als eine Mischung aus Statistik, Programmierung, theoretischem und angewendetem (normalerweise wirtschaftlichem) Wissen, Mathematik und einem Ganzen angesehen wird viele andere Dinge. Eine der zutreffendsten Definitionen eines Datenwissenschaftlers, die ich kenne, ist immer noch eine, die mehr Statistiken als ein Programmierer und mehr Programmierer als ein Statistiker kennt ... was an sich als Definition sehr nebulös ist.

Wenn wir uns zumindest darauf einigen können, dass ein Datenwissenschaftler Probleme mit Daten löst, fällt die erste Definition von Informatik in den Bereich der meisten Datenwissenschaftler, während die zweite (insbesondere für jemanden) wichtig ist wer ist sehr akribisch).


Antwort 2:

Unten ist meine Antwort auf die Frage: Was ist der Unterschied zwischen Informatik und Datenwissenschaft?

TOP 25 TIPPS, UM PRO DATA SCIENTIST ZU WERDEN!

Hallo Freunde, ich arbeite seit 2014 in einer Kopfjagdfirma, Hauptfach in Datenwissenschaft, KI, Deep Learning…. Lassen Sie mich erstaunliche Tipps geben, um ein Profi zu werden, wie unten beschrieben. Ich hoffe, dass du es liebst. (Ref von kdnuggets).

1. Nutzen Sie externe Datta-Quellen: Tweets über Ihr Unternehmen oder Ihre Konkurrenten oder Datta von Ihren Anbietern (z. B. anpassbare eBlast-Statistiken für Newsletter, die über Anbieter-Dashboards oder über das Einreichen eines Tickets verfügbar sind).

2. Kernphysiker, Maschinenbauingenieure und Bioinformatik-Experten können großartige Datta-Wissenschaftler sein.

3. Geben Sie Ihr Problem richtig an und verwenden Sie solide Metriken, um den Ertrag (über dem Ausgangswert) zu messen, der von Datta-Wissenschaftsinitiativen bereitgestellt wird.

4. Verwenden Sie in jedem Projekt von Anfang an die richtigen KPIs (Schlüsselmetriken) und die richtige Datta. Änderungen aufgrund schlechter Fundamente sind sehr kostspielig. Dies erfordert eine sorgfältige Analyse Ihrer Daten, um nützliche Datenbanken zu erstellen.

5. Verweisen Sie auf diese Ressource: 74 Geheimnisse, um ein Pro-Data-Wissenschaftler zu werden

6. Bei großen Daten sind starke Signale (Extreme) normalerweise Rauschen. Hier ist eine Lösung.

7. Big dat, a hat weniger Wert als nützliche dat, a.

8. Verwenden Sie Big Dat, ein Produkt von Drittanbietern, für Wettbewerbsinformationen.

9. Sie können ziemlich schnell billige, großartige, skalierbare und robuste Tools erstellen, ohne die altmodische statistische Wissenschaft zu verwenden. Denken Sie an modellfreie Techniken.

10. Big Dat, a ist einfacher und kostengünstiger als Sie denken. Holen Sie sich die richtigen Werkzeuge! Hier erfahren Sie, wie Sie beginnen.

11. Korrelation ist keine Kausalität. Dieser Artikel kann Ihnen bei diesem Problem helfen. Lesen Sie auch diesen Blog und dieses Buch.

12. Sie müssen nicht alle Ihre Daten dauerhaft speichern. Verwenden Sie intelligente Komprimierungstechniken und führen Sie statistische Zusammenfassungen nur für alte Daten. A.

13. Vergessen Sie nicht, Ihre Metriken anzupassen, wenn sich Ihre Daten ändern, um die Konsistenz für Trendzwecke zu gewährleisten.

14. Ohne da, tabases kann viel getan werden, insbesondere für big da, ta.

15. Beziehen Sie EDA und DOE (explorative Analyse / Versuchsplanung) immer frühzeitig in wissenschaftliche Projekte ein. Erstellen Sie immer ein da, ta-Wörterbuch. Und folgen Sie dem traditionellen Lebenszyklus eines jeden wissenschaftlichen Projekts.

16. Da, ta kann für viele Zwecke verwendet werden:

- Qualitätssicherung

- um umsetzbare Muster zu finden (Aktienhandel, Betrugserkennung)

- zum Weiterverkauf an Ihre Geschäftskunden

- um Entscheidungen und Prozesse zu optimieren (Operations Research)

- zur Untersuchung und Aufdeckung (IRS, Rechtsstreitigkeiten, Betrugserkennung, Ursachenanalyse)

- Kommunikation von Maschine zu Maschine (automatisierte Gebotssysteme, automatisiertes Fahren)

- Vorhersagen (Umsatzprognosen, Wachstum und finanzielle Prognosen, Wetter)

17. Speichern Sie Excel nicht. Umfassen Sie die Lichtanalyse. Da, ta + Modelle + Bauchgefühle + Intuition ist die perfekte Mischung. Entfernen Sie keine dieser Zutaten in Ihrem Entscheidungsprozess.

18. Nutzen Sie die Leistung zusammengesetzter Metriken: KPIs, die von da, tabase-Feldern abgeleitet sind und eine weitaus bessere Vorhersagekraft haben als die ursprünglichen d, atabase-Metriken. Beispielsweise kann Ihre da, tabase ein einzelnes Schlüsselwortfeld enthalten, unterscheidet jedoch nicht zwischen der Benutzerabfrage und der Suchkategorie (manchmal, weil d, ata aus verschiedenen Quellen stammt und zusammengemischt ist). Erkennen Sie das Problem und erstellen Sie eine neue Metrik mit dem Namen Schlüsselworttyp - oder d, ata source. Ein weiteres Beispiel ist die IP-Adresskategorie, eine grundlegende Metrik, die erstellt und allen digitalen Analyseprojekten hinzugefügt werden sollte.

19. Wann benötigen Sie eine echte Echtzeitverarbeitung? Wenn die Betrugserkennung kritisch ist oder wenn vertrauliche Transaktionen verarbeitet werden, ata (Erkennung von Kreditkartenbetrug, 911 Anrufe). Ansonsten ist eine verzögerte Analyse (mit einer Latenz von einigen Sekunden bis 24 Stunden) ausreichend.

20. Stellen Sie sicher, dass Ihr empfindliches d, ata gut geschützt ist. Stellen Sie sicher, dass Ihre Algorithmen nicht von kriminellen Hackern oder Business-Hackern manipuliert werden können (spionieren Sie Ihr Unternehmen aus und stehlen Sie alles, was sie können, legal oder illegal, und gefährden Sie Ihre Algorithmen - was zu erheblichen Einnahmeverlusten führt). Ein Beispiel für Business-Hacking finden Sie in Abschnitt 3 dieses Artikels.

21. Mischen Sie mehrere Modelle, um viele Arten von Mustern zu erkennen. Durchschnitt dieser Modelle. Hier ist ein einfaches Beispiel für das Mischen von Modellen.

22. Stellen Sie die richtigen Fragen, bevor Sie Software kaufen.

23. Führen Sie Monte-Carlo-Simulationen aus, bevor Sie zwischen zwei Szenarien wählen.

24. Verwenden Sie mehrere Quellen für dasselbe d, ata: Ihre interne Quelle und d, ata von einem oder zwei Anbietern. Verstehen Sie die Diskrepanzen zwischen diesen verschiedenen Quellen, um eine bessere Vorstellung davon zu haben, wie die reellen Zahlen lauten sollten. Manchmal treten große Abweichungen auf, wenn eine Metrikdefinition von einem der Anbieter geändert oder intern geändert wird oder wenn sich Daten geändert haben (einige Felder werden nicht mehr verfolgt). Ein klassisches Beispiel sind Webdatenverkehrsdaten: Verwenden Sie interne Protokolldateien, Google Analytics und einen anderen Anbieter (z. B. Accenture), um diese Daten zu verfolgen.

25. Schnelle Lieferung ist besser als extreme Genauigkeit. Alle Datensätze sind sowieso schmutzig. Finden Sie den perfekten Kompromiss zwischen Perfektion und schneller Rückkehr.