Scatter Plot Apa Itu

Scatter Plot Apa Itu

Scatter plot matrices

For a set of data variables (dimensions) X1, X2, ... , Xk, the scatter plot matrix shows all the pairwise scatter plots of the variables on a single view with multiple scatterplots in a matrix format. For k variables, the scatterplot matrix will contain k rows and k columns. A plot located on the intersection of row and jth column is a plot of variables Xi versus Xj.[10] This means that each row and column is one dimension, and each cell plots a scatter plot of two dimensions.[citation needed]

A generalized scatter plot matrix[11] offers a range of displays of paired combinations of categorical and quantitative variables. A mosaic plot, fluctuation diagram, or faceted bar chart may be used to display two categorical variables. Other plots are used for one categorical and one quantitative variables.

Scatter plot adalah sebuah grafik yang biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Untuk bisa menggunakan scatter plot, skala data yang digunakan haruslah skala interval dan rasio.

Contoh grafik scatter plot bisa dilihat seperti gambar dibawah ini :

Gambar 1. Scatter plot

Gambar 1 adalah scatter plot antara prosentase kepemilikan mobil pada suatu kota di Amerika Serikat dengan pendapatan rumah tangga. Gambar 1 menunjukkan bahwa peningkatan prosentase kepemilikan mobil juga diikuti oleh pendapatan rumah tangga.

Gambar 2. Keeratan hubungan

Jika scatter plot membentuk pola yang menyerupai garis lurus seperti pada gambar 2, mengindikasikan bahwa ada hubungan yang erat antara variabel 1 dengan variabel 2.

Hubungan yang membentuk garis lurus biasa disebut dengan hubungan linier. Hubungan linier bisa bisa membentuk hubungan yang positif dan negatif.

Gambar 3. Hubungan positif

Jika plot yang terjadi seperti pada gambar 3, maka variabel 1 dan variabel 2 menunjukkan hubungan yang positif. Peningkatan yang terjadi pada variabel 1 juga diikuti peningkatan pada variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 juga mengalami penurunan

Bahasa mudahnya adalah kalau naik ya naik semua dan kalau turun ya turun semua.

Gambar 4. Hubungan negatif

Jika plot yang terjadi seperti pada gambar 4, maka variabel 1 dan variabel 2 menunjukkan hubungan yang negatif. Peningkatan yang terjadi pada variabel 1 diikuti penurunan oleh variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 akan mengalami peningkatan.

Bahasa mudahnya adalah kalau satunya naik yang lain turun dan kalau satunya turun maka yang lain akan naik.

Gambar 5. Hubungan yang rendah atau tidak ada hubungan

Jika plotnya menyebar seperti pada gambar 5, maka bisa disimpulkan bahwa hubungan antara variabel 1 dengan variabel 2 sangatlah kecil Atau tidak ada hubungan.

Selain hubungan linier, kita juga bisa melihat hubungan yang lain seperti hubungan non linier.

Gambar 6. Hubungan non linier

Jika plot yang terjadi membentuk curva seperti gambar 6, maka diindikasikan terjadi hubungan non linier antara 2 variabel.

Scatter plot juga bisa digunakan untuk melihat penyebaran data. Apakah data menyebar ataukah mengumpul disuatu area.

Gambar 7. Data menyebar

Gambar 8. Data mengumpul di suatu area

Scatter plot juga bisa menunjukkan kita adanya outlier. Outlier adalah data yang ekstrim yang kemungkinan dihasilkan dari situasi yang tidak normal. Kebanyakan peneliti akan mengambil data outlier ini untuk diteliti lebih lanjut.

Istilah scatter plot tidak terasa asing bagi kita. Mungkin Anda telah mengetahuinya bahkan sejak di bangku SMA. Namun penggunaan scatter plot mungkin masih kurang saat kita berada di sekolah.

Dalam visualisasi data, kita perlu menggunakan fitur scatter plot ini. Scatter plot dapat membantu Anda atau audiens Anda dalam memahami data yang memiliki sebuah hubungan korelasi.

Pada artikel saya kali ini, kita akan membahas tentang visualisasi data menggunakan scatter plot. Berikut penjelasannya

Scatter plot atau diagram pencar adalah salah satu jenis visualisasi data. Scatter plot dapat menunjukkan hubungan antara variabel yang berbeda. Data ditampilkan dengan cara menempatkan berbagai titik data antara sumbu x (horizontal) dan sumbu y (vertikal).

Setiap titik data seperti terlihat “tersebar” di sekitar grafik, yang menjadikan nama untuk jenis visualisasi data ini.

Scatter plot juga biasa disebut grafik x-y. Tujuan dari penggunaan scatter plot salah satunya adalah untuk menentukan apakah ada pola atau korelasi antara dua variabel.

Pola atau korelasi antara dua variabel pada scatter plot memiliki fitur yang berbeda, yakni sebagai berikut:

Setiap jenis grafik atau jenis visualisasi data memiliki aturannya tersendiri. Pemilihan grafik yang tepat akan menjadikan visualisasi data yang Anda presentasikan mampu menyuguhkan informasi yang tepat.

Jika Anda mencoba untuk melihat arti dalam dua variabel yang berbeda. Maka scatter plot dapat membantu Anda menentukan apakah ada hubungan potensial antara variabel x dan variabel y.

Sebagai contoh jika Anda memiliki bisnis es krim. Anda ingin mengetahui, apakah ada pola mengapa penjualan Anda rendah akhir-akhir ini. Maka Anda dapat membuat scatter plot untuk mengukur, misal hubungan antara penjualan, dengan suhu luar

Seperti yang terlihat pada grafik di atas, orang-orang cenderung membeli es krim ketika suhu luar ruangan meningkat, sedangkan jika suhu luar ruangan semakin dingin, penjualan akan semakin menurun

Jika Anda memiliki dua variabel yang berpasangan dengan baik, menggunakan scatter plot adalah cara yang tepat untuk melihat hubungan dan melihat apakah korelasinya positif atau negatif.

Sebagai contoh, berat lahir bayi dengan usia kehamilan (berapa lama bayi berada di dalam rahim). Masuk akal jika bay, yang bisa tumbuh di dalam perut ibunya lebih lama akan menjadikan bayi tersebut lebih besar, dan karenanya akan menjadi lebih berat, bukan?

Seperti yang kita dapat perkirakan, Jika semakin lama bayi berada dalam kandungan, maka semakin berat badannya saat lahir

Sama seperti ketika ada waktu tertentu menggunakan scatter plot, maka ada waktu ketika Anda harus menghindari penggunaanya dalam memvisualisasikan data. Berikut waktu Anda harus menghindarinya.

1- Hindari scatter plot, ketika data Anda sama sekali tidak terkait

Jika data Anda menunjukkan bahwa tidak ada korelasi, maka scatter plot tidak akan berguna untuk memvisualisasikan data Anda.

Misalnya, jika Anda mengumpulkan survei acak pada audiens Anda, tentang tinggi tubuh audiens, dengan jumlah hewan peliharaan yang mereka miliki di rumah. Itu sangat tidak masuk akal untuk dihubungkan dalam scatter plot.

Kedua variabel di atas jelas tidak memiliki hubungan apapun, dan meskipun masih menyenangkan untuk dibuat grafik, maka untuk solusinya, Anda bisa beralih ke diagram batang sebagai pilihan yang baik.

2- Hindari scatter plot, ketika Anda memiliki kumpulan data yang terlalu besar

Jika Anda memiliki begitu banyak data, saran dari visme adalah menghindarinya.

Ahli statistik Nathan Yau, menyimpulkan fenomena ini dengan cukup baik dalam grafik di atas.

sebagai contoh lain, lihat scatter plot di bawah ini,. Sangat pada sehingga pada dasarnya menjadi satu kumpalan besar dan sulit untuk memahami isi data dari diagram semacam ini.

Jika memang data Anda terlalu banyak pertimbangkan menggunakan grafik dalam bentuk Heat Map. Ini dapat menunjukkan di mana bagian paling banyak dari data Anda berada

Anda juga dapat memberi kode warna pada berbagai kumpulan data menggunakan titik data tembus cahaya untuk membuat efek seperti heat map dan banyak lagi.

Nah itu tadi pembahasan terkait visualisasi data dengan scatter plot . Nantikan tulisan saya berikutnya ya. feel free to share and give new insight for all.

Scatter Plot sering juga disebut dengan bagan sebar atau grafik sebar, adalah penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Scatter plot digunakan untuk mengamati hubungan antar variabel.

Contoh Scatter Plot di atas menunjukkan diameter dan tinggi untuk sampel pohon fiksi. Setiap titik mewakili satu pohon; posisi horizontal setiap titik menunjukkan diameter pohon (dalam sentimeter) dan posisi vertikal menunjukkan tinggi pohon (dalam meter).

Dari plot, kita dapat melihat korelasi positif yang secara umum erat antara diameter pohon dan tingginya. Kita juga bisa mengamati titik outlier, sebuah pohon yang diameternya jauh lebih besar dari yang lain. Pohon ini tampak cukup pendek untuk ketebalannya, yang mungkin memerlukan penyelidikan lebih lanjut.

Contoh struktur data Scatter Plot

Untuk membuat plot sebar, kita perlu memilih dua kolom dari tabel data, satu untuk setiap dimensi plot. Setiap baris tabel akan menjadi satu titik dalam plot dengan posisi sesuai dengan nilai kolom.

Referensi : https://chartio.com/learn/charts/what-is-a-scatter-plot/

Dipublikasikan oleh Farrel Hanif Fathurahman

Plot sebar atau sebar (juga dikenal sebagai sebar, sebar, sebar, sebar, atau sebar) adalah grafik atau diagram matematika yang menggunakan koordinat Kartesius untuk mewakili nilai dua variabel. Semacam data Jika simbol (warna/bentuk/ukuran) ditentukan, variabel lain dapat ditampilkan. Data disajikan sebagai kumpulan titik-titik dengan nilai salah satu variabel menentukan posisi pada sumbu horizontal dan nilai variabel lain menentukan posisi pada sumbu vertikal.

Waktu tunggu antara letusan dan durasi letusan untuk Old Faithful Geyser di Taman Nasional Yellowstone, Wyoming, AS. Bagan ini menunjukkan secara umum ada dua jenis letusan: durasi pendek-tunggu-pendek, dan durasi-tunggu-lama-lama.

Grafik 3D memungkinkan Anda memvisualisasikan banyak data. Plot sebar ini menggunakan variabel skalar untuk sumbu ruang yang berbeda. Variabel-variabel tersebut digabungkan membentuk koordinat dalam ruang, yang ditampilkan dengan mesin terbang dan warna dengan variabel skalar lainnya.

Observasi dapat digunakan ketika suatu variabel kontinu dimanipulasi secara eksperimental, yang satu bergantung pada yang lain, atau dua variabel kontinu bersifat independen. Jika suatu parameter secara sistematis menaikkan atau menurunkan parameter lainnya, maka disebut parameter kontrol atau variabel bebas dan diplot pada sumbu horizontal. Variabel terukur atau variabel terikat biasanya diplot pada sumbu vertikal. Jika tidak ada variabel terikat, maka kedua variabel dapat ditampilkan pada satu sumbu, dan hanya scatter plot yang menunjukkan derajat korelasi (bukan sebab akibat) antar variabel.

Plot sebar dapat menunjukkan berbagai hubungan antar variabel dan lokasi tertentu. Misalnya berat badan dan tinggi badan berada pada sumbu y dan tinggi badan berada pada sumbu x. Korelasinya bisa positif (meningkat), negatif (menurun), atau 0 (tidak ada korelasi). Jika pola titik-titiknya miring dari kiri atas ke kanan atas, menunjukkan adanya hubungan positif antar variabel yang diteliti. Jika pola titik miring dari kiri atas ke kanan bawah, menunjukkan korelasi negatif. Untuk mempelajari hubungan antar variabel, Anda dapat menggambar garis yang paling sesuai (disebut “garis tren”).

Persamaan hubungan antar variabel dapat ditentukan dengan sangat tepat. Untuk regresi linier, metode terbaik disebut regresi linier, yang dijamin menghasilkan solusi yang tepat dalam waktu singkat. Tidak ada metode yang diterima secara universal untuk menghasilkan solusi sambungan air yang benar. Plot sebar sangat berguna ketika Anda ingin melihat perbandingan dua kumpulan data untuk menunjukkan non-korelasi antar variabel. Kemampuan melakukan hal ini dapat ditingkatkan dengan menambahkan garis tipis seperti LOESS. Selain itu, ketika data direpresentasikan sebagai model asosiasi sederhana, hubungan ini dapat dilihat sebagai model bertingkat. Diagram pencar adalah salah satu dari tujuh alat dasar pengendalian kualitas.Bagan sebar dapat dibuat dalam bentuk bagan gelembung, penanda, atau/dan garis.

Misalnya, untuk menunjukkan hubungan antara daya hidup seseorang dan berapa lama mereka dapat bernapas, seorang peneliti memilih sekelompok orang untuk dipelajari dan mengukur daya hidup setiap orang (pertama indeks) dan kapan mereka dapat menahan napas. Mampu menahan nafas Mampu menahan nafas (variabel kedua). Peneliti memplot data dalam diagram sebar, menetapkan "kapasitas paru-paru" pada sumbu horizontal dan "waktu menahan napas" pada sumbu vertikal.

Seseorang memiliki kapasitas 400 cl Menahan napas dalam waktu lama. . . 21,7 detik diwakili oleh satu titik pada diagram sebar di titik (400, 21,7) dalam koordinat Cartesian. Plot sebar untuk semua individu dalam suatu penelitian memungkinkan peneliti membandingkan dua variabel dalam kumpulan data secara visual dan membantu menentukan jenis hubungan yang ada di antara keduanya.

Untuk himpunan data variabel (dimensi) Jarak antara baris dan kolom ke-j merupakan grafik variabel Xi dan Xj. Artinya, setiap baris dan kolom adalah satu dimensi, dan setiap sel mencetak sebar dua dimensi.

Sebar normal memperlihatkan pasangan variabel dan ukuran kategori. Anda dapat menampilkan variabel dua arah menggunakan plot petak, plot varians, atau grafik batang segi. Grafik yang berbeda digunakan untuk variabel kategori dan variabel kuantitatif.

Disadur dari: en.wikipedia.org

Plot using the dispersal of scattered dots to show the relationship between variables

A scatter plot, also called a scatterplot, scatter graph, scatter chart, scattergram, or scatter diagram,[2] is a type of plot or mathematical diagram using Cartesian coordinates to display values for typically two variables for a set of data. If the points are coded (color/shape/size), one additional variable can be displayed. The data are displayed as a collection of points, each having the value of one variable determining the position on the horizontal axis and the value of the other variable determining the position on the vertical axis.[3]

According to Michael Friendly and Daniel Denis, the defining characteristic distinguishing scatter plots from line charts is the representation of specific observations of bivariate data where one variable is plotted on the horizontal axis and the other on the vertical axis. The two variables are often abstracted from a physical representation like the spread of bullets on a target or a geographic or celestial projection.[4][5]

While Edmund Halley created a bivariate plot of temperature and pressure in 1686, he omitted the specific data points used to demonstrate the relationship. Friendly and Denis claim his visualization was different from an actual scatter plot. Friendly and Denis attribute the first scatter plot to John Herschel. In 1833, Herschel plotted the angle between the central star in the constellation Virgo and Gamma Virginis over time to find how the angle changes over time, not through calculation but with freehand drawing and human judgment.[4]

Sir Francis Galton extended and popularized the scatter plot and many other statistical tools to pursue a scientific basis for eugenics.[6] When, in 1886, Galton published a scatter plot and correlation ellipse of the height of parents and children, he extended Herschel's mere plotting of data points by binning and averaging adjacent cells to create a smoother visualization.[4] Karl Pearson, R. A. Fischer, and other statisticians and eugenicists built on Galton's work and formalized correlations and significance testing.[6]

A scatter plot can be used either when one continuous variable is under the control of the experimenter and the other depends on it or when both continuous variables are independent. If a parameter exists that is systematically incremented and/or decremented by the other, it is called the control parameter or independent variable and is customarily plotted along the horizontal axis. The measured or dependent variable is customarily plotted along the vertical axis. If no dependent variable exists, either type of variable can be plotted on either axis and a scatter plot will illustrate only the degree of correlation (not causation) between two variables.[citation needed]

A scatter plot can suggest various kinds of correlations between variables with a certain confidence interval. For example, weight and height would be on the y-axis, and height would be on the x-axis. Correlations may be positive (rising), negative (falling), or null (uncorrelated). If the dots' pattern slopes from lower left to upper right, it indicates a positive correlation between the variables being studied. If the pattern of dots slopes from upper left to lower right, it indicates a negative correlation. A line of best fit (alternatively called 'trendline') can be drawn to study the relationship between the variables. An equation for the correlation between the variables can be determined by established best-fit procedures. For a linear correlation, the best-fit procedure is known as linear regression and is guaranteed to generate a correct solution in a finite time. No universal best-fit procedure is guaranteed to generate a correct solution for arbitrary relationships. A scatter plot is also very useful when we wish to see how two comparable data sets agree to show nonlinear relationships between variables. The ability to do this can be enhanced by adding a smooth line such as LOESS.[7] Furthermore, if the data are represented by a mixture model of simple relationships, these relationships will be visually evident as superimposed patterns.[citation needed]

The scatter diagram is one of the seven basic tools of quality control.[8]

Scatter charts can be built in the form of bubble, marker, or/and line charts.[9]

For example, to display a link between a person's lung capacity, and how long that person could hold their breath, a researcher would choose a group of people to study, then measure each one's lung capacity (first variable) and how long that person could hold their breath (second variable). The researcher would then plot the data in a scatter plot, assigning "lung capacity" to the horizontal axis, and "time holding breath" to the vertical axis.[citation needed]

A person with a lung capacity of 400 cl who held their breath for 21.7 s would be represented by a single dot on the scatter plot at the point (400, 21.7) in the Cartesian coordinates. The scatter plot of all the people in the study would enable the researcher to obtain a visual comparison of the two variables in the data set and will help to determine what kind of relationship there might be between the two variables.[citation needed]

Published by adhibagus

Konsultan, Trainer & Designer Visualisasi Data merupakan seorang yang berprofesi dibidang visualisasi dan design data View all posts by adhibagus

Capaian Pembelajaran :  Menggunakan diagram pencar untuk menyelediki dan menjelaskan hubungan antara dua variabel numerik

Tujuan Pembelajaran :

1.  Menyajikan diagram pencar dari sepasang data

2.  Menjelaskan hubungan antara dua variabel numerik antara dua variabel

Pengertian Diagram Pencar

Diagram pencar merupakan penyajian data dalam bentuk penyebaran titik-titik pada diagram kartesius yang berguna untuk menunjukkan ada atau tidaknya hubungan/korelasi antara dua variabel kuantitatif yang disebut dengan data bivariat.

Jenis – jenis varibel variabel

1.        Variabel Bebas merupakan variabel yang memberikan pengaruh terhadap variabel lainnya. istilah lain dari variabel bebas yaitu variabel independen/variabel stimulus/ variabel input/variabel predictor/variabel anteseden yang disimbolkan dengan X

2.       Variabel terikat merupakan variabel yang dipengaruhi oleh variabel lainnya tapi tidak dapat mempengaruhi variabel lainnya. Istilah lain dari variabel terikat yaitu variabel dependen/variabel outpot/ variabel respon/variabel criteria/variabel konsekuen yang disimbolkan dengan Y

Menggambar diagram pencar secara manual

1.       Menentukan variabel bebas (X) dan variabel terikat (Y)

2.       Temukanlah nilai tertinggi dan nilai terendah untuk setiap variabel

3.       Membuat diagram kartesius dengan skala yang sama untuk memuat seluruh nilai pada setiap data.

4.       Menggambarkan setiap pasangan titik-titik (X,Y) pada diagram kartesius.

Gambarkan diagram pencar tentang pengaruh jumlah penduduk miskin terhadap jumlah talak dan cerai (pasangan nikah) tahun 2016 di Pulau Sumatera.

Jumlah Penduduk Miskin tahun 2016

Jumlah Talak dan Cerai (Pasangan Nikah) tahun 2016

Variabel bebas (X) :  Jumlah penduduk miskin tahun 2016

Variabel terikat (Y) :  Jumlah talak dan cerai pada pasangan nikah tahun 2016

Nilai minimal (X) =  71071

Nilai maksimal (X) =  1452550

Nilai minimal (Y) =  0

Offenbar hast du diese Funktion zu schnell genutzt. Du wurdest vorübergehend von der Nutzung dieser Funktion blockiert.

Kapan menggunakan Scatter Plot ?

Kegunaan utama scatter plot adalah untuk mengamati dan menunjukkan hubungan antara dua variabel numerik. Titik-titik dalam sebar plot tidak hanya melaporkan nilai titik data individual, tetapi juga pola ketika data diambil secara keseluruhan.

Identifikasi hubungan korelasional yang umum dengan plot pencar. Dalam kasus ini, kami ingin tahu, jika kami diberi nilai horizontal tertentu, prediksi yang baik untuk nilai vertikal. Anda akan sering melihat variabel pada sumbu horizontal dilambangkan sebagai variabel bebas, dan variabel pada sumbu vertikal adalah variabel terikat. Hubungan antar variabel dapat digambarkan dalam banyak cara: positif atau negatif, kuat atau lemah, linier atau nonlinier.