Selasa, 07 September 2021

Konsep Dasar Probability dan Counting

Konsep dasar Probability dan Counting

Probability

Probability adalah pengukuran terhadap suatu kemungkinan dan peluang.

Terminologi

Adalah hasil dari sebuah percobaan (trial) yang dikenal dengan Outcome.

Probability Experiments

Adalah aksi atau percobaan (trial) yang menghasilkan suatu perhitungan, pengukuran, atau respon.

Tree diagram

Digunakan untuk memberikan gambaran secara visual terkait setiap outcome dari suatu probability experiment.



Fundamentan counting principle

Pemanfaatan tree diagram untuk menghitung banyaknya outcome dari sejumlah event tidaklah praktis.

Types of Probability

Probability dapat dituliskan dalam format pecahan, desimal dan presentasi.

Terdapat 3 tipe Probability :

1. Classical (theorotical) Probability

2. Empirical (statistical) Probability

3. Subjective Probability

Complementary Event



Probability (studi kasus)




Minggu, 29 Agustus 2021

Measure Of Position

 Measure Of Position

Pengertian Measure of Variation

Measure of Variation dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.

Quartile (kuartil)

Quartile adalah nilai yang membagi suatu dataset terurut menjadi empat bagian yang sama.

Terdapat empat nilai quartile yaitu Q¹, Q², Q³.



Interquartile Range (IQR)

Interquartile Range (IQR) adalah measure of varation (pengukuran keberagaman/selembaran data) dengan menselisihkan nilai quartile ketiga dan quartile pertama.



Box and Whisker Plots



Precentile (presentil)

Adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama.

  • P25 menunjukkan posisi yang sama dengan Q¹
  • P50 menunjukkan posisi yang sama dengan Q²
  • P75 menunjukkan posisi yang sama dengan Q³


Standard Score (Z-score)

Standard score merepresentasikan nilai simpangan suatu entri data terhadap mean dari suatu dataset yang diukur berdasarkan standard deviation.



Minggu, 01 Agustus 2021

Measure Of Variation

 Pengukuran Sebaran Data 

Measure Of Variation dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.

Range (jangkauan)

Range dari suatu dataset merupakan selisih antara data dengan nilai yang terbesar dengan data denga nilai yang terkecil tersebut.

Variance (variasi)

Variance dari suatu dataset merupakan hasil perhitungan rerata simpangan tiap entri data pada dataset terhadap nilai mean dari dataset tersebut.

Standard Deviation (simpangan baku)

Kelemahan utama dari variance adalah nilai yang dihasilkan tidak memiliki satuan yang sama dengan entri data. Kelemahan ini dapat diatasi dengan Standard Deviation.

Empirical Rule

Empirical Rule dapat diterapkan dalam bentuk distribusi simetris (bell shaped).

Chebychev’s Theorem

Teori peluang, ketaksamaan/ketidaksamaan Chebyshev menjamin bahwa pada setiap data sampel atau distribusi peluang, hampir semua nilai-nilainya mendekati rata-rata. Tepatnya, bahwa tidak lebih 1/k2 dari nilai distribusi melebihi k standar deviasinya.

Standard Deviation for Grouped Data

Coefficient Of Variation

Koefisien variasi merupakan suatu ukuran variansi yang dapat digunakan untuk membandingkan suatu distribusi data yang mempunyai satuan yang berbeda. Koefisien variasi adalah suatu perbandingan antara simpangan baku dengan nilai rata-rata dan dinyatakan dengan persentase.




Sabtu, 31 Juli 2021

Measure Of Central Tendency

Measure Of Central Tendency dalam Statistika

Measure of Central Tendency dapat didefinisikan sebagai sutu pengukuran nilai yang dapat digunakan untuk merepresentansikan nilai tipikal atau sentral dari suatu dataset.

Mean

Mean dari suatu dataset merupakan penjumlahan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri pada dataset tersebut.

rumus :


Contoh :


Median

Median dari suatu dataset merupakan nilai yang berada ditengah dengan mengacu pada nilai dataset yang sudah terurut.


Mode

Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.


Weighted Mean

Weighted Mean adalah nilai rerata dari suatu dataset dimana setiap entrinya memiliki bobot tertentu.

Mean of Grouped Data (Frequency Distribution)

Kita juga dapat melakukan estimasi nilai rerata dari suatu dataset yang sudah dikelompokkan kedalam format distribusi frekuensi.



Kelebihan dan Kekurangan Mean :

Kelebihan mean adalah:

1.Rata-rata lebih dikenal banyak orang sehingga penggunaannya lebih mudah.

2.Setiap rangkaian data kuantitatip memiliki rata-rata dan hanya satu rata-rata.

3 Oleh karena perbedaan data memiliki hanya satu rata-rata,maka ukuran pusat data ini dapat digunakan dengan baik dalam prosedur-prosedur statiska seperti mengatur dua atau lebih rangkaian data.

Kelemahan mean adalah:

1.Oleh karena rata-rata dihitung dari seluruh data pengamatan,maka rata-rata sangat peka terhadap angka-angka data ekstrim. Dengan demikian,rata-rata dari data yang memiliki angka-angka yang besar akan menjadi kurang representatip.

2.Untuk data kualitatip,rata-rata tidak dapat digunakan untuk menentukan ukuran pusat datanya.

3.Untuk data yang telah dikelompokkan hasil perhitungannya tidak mencerminkan rata-rata yang sebenarnya.

4.Untuk data yang telah dikelompokkan dengan kelas terbuka,rata-rata tidak dapat dihitung.


Visualisasi Data

 Visualisasi Data

Visualisasi data adalah representasi grafis dari data dan informasi. Dengan menggunakan elemen-elemen visual seperti diagram, grafik dan peta, komunikasi data dan informasi menjadi lebih mudah.

Berikut beberapa teknik visualisasi data yang akan dipelajari :

Stem and Leaf Plot


Dot Plot


Pie Chart


Bar Plot


Scatter Plot


Time Series Chart


Visualisasi Data dengan Python




Sabtu, 24 Juli 2021

Distribusi Frekuensi

Distribusi Frekuensi (Frequency Distribution)

Distribusi frekuensi adalah sebuah daftar, tabel, atau diagram yang menunjukkan frekuensi berbagai kejadian dalam suatu sampel. Setiap butir atau baris dalam tabel menunjukkan frekuensi atau jumlah terjadinya nilai dalam kelompok atau interval tersebut.

Jenis-jenis Distribusi Frekuensi :

• Distribusi frekuensi biasa

Distribusi frekuensi yang berisikan jumlah frekuensi dari setiap kelompok data. Distribusi frekuensi ada dua jenis yaitu distribusi frekuensi numerik dan distribusi frekuensi peristiwa atau kategori.

• Distribusi frekuensi relatif

Distribusi frekuensi yang berisikan nilai-nilai hasil bagi antara frekuensi kelas dan jumlah pengamatan. Distribusi frekuensi relatif menyatakan proporsi data yang berada pada suatu kelas , distribusi frekuensi relatif pada suatu kelas didapatkan dengan cara membagi frekuensi dengan total data yang ada dari pengamatan atau observasi.

• Distribusi frekuensi kumulatif

Distribusi frekuensi yang berisikan frekuensi kumulatif (frekuensi yang dijumlahkan). Distribusi frekuensi kumulatif memiliki kurva yang disebut ogif. Ada dua macam distribusi frekuensi kumulatif yaitu distribusi frekuensi kumulatih kurang dari dan distribusi frekuensi lebih dari.

Histogram


Frequency Polygon


Ogive




Pengumpulan Data Statistika

 Pengumpulan Data (Data Collection)

Sensus

Pengertian Sensus adalah cara pengumpulan data apabila seluruh elemen populasi diselidiki satu per satu. Data yang diperoleh tersebut merupakan hasil pengolahan sensus disebut sebagai data yang sebenarnya (true value), atau sering juga disebut parameter.

Sampling

Pengertian Sampling adalah cara pengumpulan data apabila yang diselidiki berupa sampel dari suatu populasi. Data yang didapat dari hasil sampling merupakan data perkiraan (estimated value). Jadi, jika dari 100 perusahaan hanya akan diselidiki 10 saja, maka hasil dari penyelidikannya merupakan suatu perkiraan.

Teknik Sampling (Sampling Techniques)

Simple Random Sampling

Simple Random Sampling adalah pengambilan anggota sampel dari populasi yang dilakukan secara acak tanpa memperhatikan strata yang ada dalam populasi itu.

Stratified Sampling

Merupakan proses pengambilan sampel melalui cara pembagian populasi ke dalam strata, memilih sampel acak setiap stratum, dan menggabungkannya untuk menaksir parameter populasi.

Cluster Sampling

Cluster sampling adalah teknik sampling dimana peneliti membentuk beberapa cluster dari hasil penyeleksian sebagian individu yang menjadi bagian dari sebuah populasi.

Systematic Sampling

Merupakan sistem pengambilan sampel yang dilakukan dengan menggunakan selang interval tertentu secara berurutan.

Convenience Sampling

Convenience sampling adalah prosedur sampling yang memilih sampel dari orang atau unit yang paling mudah dijumpai atau diakses.


Konsep Dasar Probability dan Counting

Konsep dasar Probability dan Counting Probability Probability adalah pengukuran terhadap suatu kemungkinan dan peluang. Terminologi Adalah h...