Ilmu data
Artikel ini bukan mengenai Ilmu informasi.
Ilmu data (bahasa Inggris: data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur.[1][2] Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, analisis data, pengolahan data, manajemen data, kearsipan, pengelompokan data, penyajian data, distribusi data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang.
Ilmu data merupakan kombinasi dari ilmu sains dan ilmu sosial. Ilmu-ilmu yang menjadi penunjang utama dalam ilmu data terdiri dari matematika, statistika, ilmu komputer, sistem informasi, manajemen, ilmu informasi, termasuk juga ilmu komunikasi dan ilmu perpustakaan, kearsipan, dan dokumentasi.[3] Bahkan ilmu ekonomi, terutama ilmu bisnis, juga berperan penting dalam ilmu data.[4]
Etimologi
[sunting | sunting sumber]Penggunaan awal
[sunting | sunting sumber]Pada tahun 1962, John Tukey menggambarkan sebuah bidang pengetahuan yang dia sebut "data analisis", yang telah menyusun data sains modern.[5] Tahun 1985, pada sesi kuliah yang diberikan oleh Akademi Sains Cina di Beijing, C.F Jeff Wu menggunakan istilah data sains untuk pertama kalinya sebagai alternatif nama untuk statistika.[6] Selanjutnya, peserta simposium statistika Universitas Montpellier II mengakui munculnya sebuah disiplin bidang baru yang fokus kepada berbagai macam bentuk dan asal data, yang dikombinasikan dengan membangun konsep menggunakan prinsip statistika dan data analisis dengan komputer.[7][8]
Istilah "data sains" bisa dilacak kembali ke tahun 1974, ketika Peter Naur mengajukan alternatif nama untuk ilmu komputer.[9] Pada tahun 1997 C.F. Jeff Wu sekali lagi menyarankan bahwa statistika harusnya diubah namanya menjadi data sains. Beliau beralasan bahwa nomenklatur baru tersebut akan membantu statistika melepaskan stereotip yang selama ini tidak akurat, seperti identik dengan akuntasi, atau hanya terbatas pada penggambaran data.[10] Pada tahun 1998, Hayashi Chikio berpendapat bahwa data sains adalah cabang ilmu pengetahuan baru dengan tiga aspek: desain data, pengumpulan data, dan analisis data.[8]
Selama tahun 1990-an, ada banyak istilah populer dalam proses menemukan pola pada kumpulan data (yang sangat luas) termasuk "penemuan pengetahuan" dan "penambangan data".[9][11]
Penggunaan di era modern
[sunting | sunting sumber]Peng-artian modern dari data sains sebagai sebuah cabang ilmu baru salah satunya berkat William S.Cleveland.[12] Dalam sebuah makalah tahun 2001 dia menganjurkan perluasan teori statistik lebih dalam ke wilayah teknis; karena akan mengubah bidang secara signifikan, sehingga membutuhkan nama baru.[11] "Data sains" menjadi lebih banyak dipakai pada tahun-tahun berikutnya setelah tahun 2002, Komite Data untuk Ilmu Pengetahuan dan Teknologi merilis Data Science Journal. Di tahun 2003, Columbia University merilis The Journal of Data Science.[11] Pada 2014 Asosiasi Statistika Amerika mengubah nama satu seksinya menjadi Pembelajaran Statistik dan Data Sains, yang menggambarkan kepopuleran dari data sains.[13]
Pada tahun 2008 DJ Patil dan Jeff Hammerbacher mempelopori gelar profesional dari "data saintis".[14] Meskipun gelar tersebut telah digunakan oleh Dewan Sains Nasional pada laporan mereka di tahun 2005, "Long-Lived Digital Data Collections: Enabling Research an Education pada Abad ke-21", yang secara luas mengacu pada peran kunci dalam mengelola sebuah kumpulan data digital.[15]
Ilmu data, ilmu disiplin terapan
[sunting | sunting sumber]Ilmu data, sesuai dengan namanya, adalah gabungan/kombinasi dari ilmu-ilmu pasti dan ilmu ekonomi (khususnya bisnis dan manajemen, terkadang juga akuntansi). Berbagai ilmu tersebut antara lain:[16]
Dasar ilmu matematika[16]
[sunting | sunting sumber]- Teori bilangan
- Persamaan linear dan Kuadrat
- Fungsi dan Relasi
- Pertidaksamaan linear dan Kuadrat
- Kalkulus
- Statistika dan Probabilitas
- Analisis prediktif dan Analisis kompleks
- Teori kategori
- Riset operasi
Dasar Ilmu komputer[16]
[sunting | sunting sumber]- Matematika diskret
- Algoritme dan Struktur data
- Teori graf, Teori grup dan ring
- Komputabilitas dan Teori informasi
Dasar Ilmu ekonomi[16]
[sunting | sunting sumber]- Ilmu Keuangan (termasuk Akuntansi)
- Manajemen
- Administrasi bisnis
- Pemecahan masalah
- Ekonometrika
- Mikroekonomi dan makroekonomi
Ilmu penunjang lainnya
[sunting | sunting sumber]- Ilmu Perpustakaan dan Informasi (Library and Information Science)
- Ilmu komunikasi
Inti dari semua ilmu tersebut adalah pemahaman terhadap data dan pengolahannya untuk menentukan kebijakan dalam bisnis dan perekonomian suatu perusahaan.[17]
Pustaka
[sunting | sunting sumber]- ^ Dhar, V. (2013). "Data science and prediction". Communications of the ACM. 56 (12): 64. doi:10.1145/2500499.
- ^ Jeff Leek (2013-12-12). "The key word in "Data Science" is not Data, it is Science". Simply Statistics. Diarsipkan dari versi asli tanggal 2014-01-02. Diakses tanggal 2016-11-23.
- ^ Virkus, Sirje; Garoufallou, Emmanouel (2019-01-01). "Data science from a library and information science perspective". Data Technologies and Applications. 53 (4): 422–441. doi:10.1108/DTA-05-2019-0076. ISSN 2514-9288.
- ^ "Predictive Analytics Degree: Northwestern SPS". northwestern.edu. Northwestern University. Diakses tanggal 28 May 2016.
The Master of Science in Predictive Analytics (MSPA) program, established in 2011, is a fully online part-time graduate program, one of the first to offer dedicated training in data science
- ^ Donoho, David (18 September 2015). "50 years of Data Science" (PDF). Diakses kembali pada 16 Mei 2021.
- ^ Wu, C. F. Jeff (1986). "Future directions of statistical research in China: a historical perspective" (PDF). Application of Statistics and Management. 1: 1–7. Diakses kembali pada 16 Mei 2021.
- ^ Data science and its applications = La @science des données et ses applications. Escoufier, Yves., Hayashi, Chikio (1918-....)., Fichet, Bernard. Tokyo: Academic Press/Harcourt Brace. 1995. ISBN 0-12-241770-4.
- ^ a b Murtagh, Fionn; Devlin, Keith (2018). "The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development". Big Data and Cognitive Computing. 2 (2): 14.
- ^ a b CaoLongbing (29 June 2017). "Data Science". ACM Computing Surveys. 50 (3): 1–42.
- ^ Wu, C.F. Jeff. "Statistics=Data Science?" Diarsipkan 2014-10-14 di Wayback Machine. (PDF). Retrieved 2 April 2020.
- ^ a b c Press, Gil. "A Very Short History Of Data Science". Forbes. Diakses kembali 16 Mei 2021.
- ^ Gupta, Shanti (11 December 2015). "William S Cleveland". Diakses kembali pada 16 Mei 2021.
- ^ Talley, Jill (1 June 2016). "ASA Expands Scope, Outreach to Foster Growth, Collaboration in Data Science". Amstat News. American Statistical Association.
- ^ Davenport, Thomas H.; Patil, D. J. (1 October 2012). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review (October 2012). ISSN 0017-8012. Diakses kembali pada 16 Mei 2021.
- ^ "US NSF - NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century". www.nsf.gov. Diakses kembali 16 Mei 2021.
- ^ a b c d Foreman, John (2013). Data Smart: Using Data Science to Transform Information into Insight. John Wiley & Sons. hlm. xiv. ISBN 9781118839867.
- ^ LaPonsie, Maryalene. "Data scientists: The Hottest Job You Haven't Heard Of". Diakses tanggal 7 October 2012.
Referensi lain
[sunting | sunting sumber]- Conway, Drew; White, John Myles (February 2012). Machine Learning for Hackers. O'Reilly Media. ISBN 978-1449303716.
- Russel, Matthew A. (October 2013). Mining the Social Web, 2nd Edition. O'Reilly Media. ISBN 978-1449367619.