weka
Weka
Weka (เวกก้า) ย่อมาจาก Waikato Environment for Knowledge Analysis พัฒนาด้วยภาษา Java โดย Waikato.ac.nz โปรแกรมนี้ถูกใช้ในการวิเคราะห์ข้อมูลด้วยเทคนิคการทำเหมืองข้อมูล (Data Mining)
+ financialsample_bi.xlsx
Analysis by SPSS
MIT
MIS
Decision Support System
What is Research?
Computer in Business
DB by MySQL
Report by PHP
Report by Flash
Report by JAVA
สอนนักศึกษา อยากสอน ให้เค้าเชื่อ
เรียนเนี่ยเพื่อ ประโยชน์ เพิ่มทักษะ
อาจได้ใช้ ภายหน้า เลี้ยงชีพนะ
หากไม่เชื่อ พอใช้ ไม่พบเอา
BI Evolution
The evolution of BI -- and its future
1980s : Report : What happened?
1990s : Analyze : Why did it happen?
2000s : Monitor : What's happening?
2010s : Predict : What will happen?
2020s : Embed Reports : Prompt Action
สถาปัตยกรรมอัจฉริยะภาพทางธุรกิจ
For business intelligence to ensure the above it is necessary that it has a robust (แข็งแรง) architecture. Business intelligence architecture is divided into six critical elements.
1. การจัดการข้อมูล (Data Management)
2. เครื่องมือแปลงข้อมูล (Transformation Tools)
3. คลังข้อมูล (Data Repositories)
4. เครื่องมือวิเคราะห์ และนำเสนอ (Analytical Tools and Presentation)
5. เครื่องมือนำเสนอ (Presentation Tools and Applications)
6. กระบวนการปฏิบัติการ (Operational Process)
+ managementstudyguide.com
7-11 กับ ตลาดย้อนยุค

@facebook.com/BeLeafGarden
คำถาม "ทำไมคนไม่เดินตลาด หายไปไหนหมด" แล้วภาครัฐ ผู้ว่าฯ ผู้ใหญ่ เจ้านาย (ลูกค้า) จะมีมาตรการอะไร ช่วยเหลือชาวตลาดโบราณย้อนยุค หรือ ปล่อยไปตามวิถี เหมือนเรื่องอื่น
จากใจลูกค้าท่านหนึ่ง แชร์ในไลน์ว่า
"เป็นทุกอย่างให้เธอแล้ววว ในที่สุด 7-11 ก็มีสองชั้นจนได้!! ที่รังสิตเป็นสาขาแรกในไทย และยังเป็นสาขาแรกที่มี All Cafe Gold ด้วยนะ ทีเด็ดอยู่ตรงชั้น 2 มีที่ให้นั่งกินแบบชิลล์ ๆ มีเบเกอรี่ ข้าว ก๋วยเตี๋ยว เครื่องดื่ม ให้สั่ง อะๆๆ ไม่ใช่อาหารเวฟอย่างที่คิดนาจาา ทำใหม่แบบสด ๆ ยอมใจเลยอะ แทบจะหาซื้อทุกอย่างได้ในเซเว่นละเด้ออออ
พิกัด : 7-Eleven สาขา BeLeaf Garden Community of Dining (ด้านหน้า รพ.แพทย์รังสิต)"
ข้อมูล (DATA) : เนื้อ กับ มะเร็ง
เค้าว่า .. ถ้ามีข้อมูลมากพอ ก็จะช่วยให้ตัดสินใจอะไร ๆ ได้
วันนี้ ได้ไปอ่านพบว่า กินเนื้อ หมู เสือดำ เป็นอาหาร จะเสี่ยงมะเร็งมากกว่า ในใจก็เกิด คัดง้าง/ย้อนแย้ง แล้วจะให้ #กินผักกินปลา หรา บางทีก็เป็นไปไม่ได้นะ ที่ลดเลิกกินสัตว์ใหญ่เอาดื้อ ๆ แล้วกินคลีน เอาเยี่ยง #ชาวฮันซา
ฉุดคิดว่า แทนที่จะเห็นการกินเนื้อ กินหมู กินเสือดำ เป็นเรื่องน่าขยะแขยง เรื่องน่ารังเกียจ แต่กลับมีความสุข ชื่นชม กดไลท์ กดแชร์ การเบียดเบียนสัตว์ทั้งเป็น และรับความเสี่ยงเข้าอยู่ร่างกายเพิ่มขึ้น ด้วยรอยยิ้ม เพราะความเชื่อว่าไม่เป็นไร และคล้อยตามสังคมรอบตัว ให้มาเป็นใหญ่เหนือความกลัว ความเชื่อเปลี่ยนไปตามค่านิยมในสังคมได้ เป็นเรื่องที่คัดง้างระหว่าง ความเชื่อ กับ ความกลัว ในแต่ละปีจะเทศกาล ทำให้ความเชื่อเรื่องกินเจ หรือกินมังสวิรัติ ถูกนำมาพูดถึง ว่ากินแล้วทำให้สุขภาพดี แต่สุขภาพดีก็จะนิยมกันช่วงเวลาสั้น เพียง 9 วันจาก 365 วัน
มีการเสนอให้พัฒนา
การศึกษาไทย
ว่า ควรหยุดท่องจำ
แต่สอนคิดริเริ่มสร้างสรรค์

.. คงดี ที่ไม่ต้องท่องจำ
แต่สำเร็จเป็นเศรษฐีได้
ด้วยความคิดสร้างสรรค์

ฟังดูดี:เรียนโดยไม่ท่องจำ
ฟังดูดี:ไม่เรียนก็เป็นเศรษฐี
ฟังดูดี:หลังห้องก็สำเร็จ
10 มหาเศรษฐี ระดับโลก
ที่เรียนไม่จบมหาวิทยาลัย
+ sanook.com
+ Disrupt University
สหพัฒน์ จัดทัพครั้งใหญ่ ให้ Big Data…ทำนายอนาคต
ภายใต้การนำทัพของเจ้าสัว บุณยสิทธิ์ โชควัฒนา ประธานเครือสหพัฒน์ ตัดสินใจดึงเทคโนโลยีอย่าง "บิ๊กดาต้า (Big Data)" เข้ามาช่วยยกระดับองค์กรให้แข็งแกร่ง พร้อมรับมือกับสนามรบทางการค้ารูปแบบใหม่ได้ดียิ่งขึ้น
Q : บิ๊กดาต้าจะเข้ามาเปลี่ยนโฉมเครือสหพัฒน์ได้อย่างไร
A : เราต้องยอมรับว่ายุคนี้เป็นยุคของบิ๊กดาต้า ซึ่งเป็นศาสตร์ใหม่ที่เกี่ยวกับชีวิตประจำวันของผู้บริโภคจำนวนมาก เดิมทีข้อมูลเหล่านี้ไม่มีใครเก็บ แต่วันนี้ต้องนำข้อมูลเหล่านั้นมา predict (ทำนาย) อนาคต ยิ่งเราเป็นผู้ผลิตสินค้าอุปโภคบริโภค มันจึงมีความสำคัญมากที่จะรู้ความต้องการของผู้บริโภคเพื่อออกสินค้า
เมื่อก่อนเวลาจะออกสินค้าตัวหนึ่งจะคิดจากมุมคนขาย ใช้เซนส์ของคน แต่วันนี้ต้องเอาข้อมูลมาวิเคราะห์ แล้วค่อยคิดว่าจะออกอะไร การค้าขายยุคใหม่ต้องออกสินค้าแล้วให้ผู้บริโภคเขาแย่งกันซื้อ จะทำแบบเก่า ๆ ไม่ได้แล้วแต่การทำเรื่องนี้ก็ไม่ได้ทำคนเดียว เพราะได้ไปจับมือกับบีทีเอสกรุ๊ป ลงนามข้อตกลงความร่วมมือ (MOU) เรื่อง “บิ๊กดาต้าพาร์ตเนอร์ชิป และบิสซิเนสคอลลาบอเรชั่น” ด้วยกัน จากความใกล้ชิดส่วนของทางผู้บริหารทั้ง 2 ฝ่าย และทรัพยากรที่ทั้ง 2 เครือมีอยู่ในมือ สามารถนำไปต่อยอดได้หลากหลาย เช่น สหพัฒน์มีสินค้า บริการ ที่ดิน ฯลฯ บีทีเอส เป็นผู้ให้บริการขนส่งระดับประเทศ ที่มีคนใช้บริการ 7-8 แสนคนต่อวัน มีธุรกิจโฆษณา อสังหาฯ โรงแรมจำนวนมาก
"เขามีข้อมูล เราเองก็มี เอามาแชร์กันจะทำให้เราทำนายอนาคตได้ดีขึ้น วันนึงมีคนขึ้นบีทีเอสหลายแสนคน ก็รู้ได้ว่าคนไปแถวไหนกันเยอะ โลเกชั่นไหนที่ทราฟฟิกดี อนาคตจะได้นำสินค้า บริการ หรือร้านค้าไปลงได้อย่างตรงจุด"
Financial Sample workbook
This is a simple Excel workbook of sample financial data available for download.
+ financialsample_bi.xlsx
File : my_data.arff
@relation my_data

@attribute sex {m,f}
@attribute prov {lp,nan,bkk}
@attribute gpa real
@attribute major {bcom,cpsc,busi}

@data
m,lp,2.1,bcom
f,nan,3.4,cpsc
f,bkk,2.8,bcom
f,lp,2.0,cpsc
m,bkk,2.7,busi
f,lp,2.0,busi
f,bkk,2.7,bcom
m,nan,3.4,cpsc
f,lp,2.0,bcom
m,bkk,2.8,cpsc
f,lp,2.1,busi
f,nan,3.5,busi
f,lp,1.9,busi
m,lp,2.0,cpsc
m,nan,3.6,bcom

ขั้นตอนการทดสอบ
- Explorer
- Open file = my_data.arff
1. พบว่า ทั้ง 4 ข้อมูลมี norminal 3 และ numeric 1
2. พบว่า class attribute ที่เป็น default คือ major ซึ่งเปลี่ยนได้
3. พบว่า Visualize All ทำให้เห็นภาพตาม class ได้ชัดเจน
4. ผลการศึกษา พบว่า
4.1 [sex] เมื่อ major เป็น class
หญิงมากกว่า หญิงเรียนบริหารมากกว่าชายชัดเจน
และ ชายเรียนคอมพิวเตอร์มากกว่าหญิง
4.2 [major] เมื่อ prov เป็น class
bcom มี bkk เรียนมากที่สุด
busi มี lp เรียนมากที่สุด
5. ใช้ Classify
เปลี่ยนจาก ZeroR เป็น Trees, J48
5.1 โดย atttribute ที่เป็น class คือ major
Correctly Classified Instances = 20%
5.2 โดย atttribute ที่เป็น class คือ prov
Correctly Classified Instances = 100%
แล้วกดปุ่ม Start
พบว่าผลการวิเคราะห์ว่า
gpa <= 2.1 คือ lp
gpa <= 2.8 คือ bkk
gpa > 2.8 คือ nan
Case #1 : ch3 in dataminingtrend.com
บทที่ 3 มารู้จัก weka กันเถอะ
โดย dataminingtrend.com : pdf
1. Download : 
+ weka-3-8-2-x64.exe 50.8 MB (64 Bit) *
+ weka-3-8-2jre-x64.exe 265.4 MB (64 Bit)
ผมเลือกแบบไม่ต้องติดตั้ง JRE เพราะในเครื่องมีแล้ว
2. เปิดโปรแกรม Weka พบหน้าจอ Weka GUI Chooser
3. คลิ๊กปุ่ม Explorer
4. ทำตามตัวอย่างที่ 3-1 มาแข่งกีฬากันเถอะ
โดยใช้แฟ้มข้อมูลในการเรียนรู้ (Training data) คือ weather.artf (489 bytes)
ซึ่งข้อมูลมี 14 rows และ 5 Attibute
ซึ่ง ARTF = (Attribute-Relation File Format)
- เริ่มต้นที่นี่
- ใน Tab : Preprocess
- download แฟ้ม weather.artf
- คลิ๊ก Open file เลือก weather.artf
เพื่อใช้เป็นข้อมูลในการเรียนรู้ (Training data)
- เข้าแท็บ Classify
- ช่อง Choose เดิมมี ZeroR
- คลิ๊ก Choose ไปเลือก Trees, J48 จะพบ J48 -C 0.25 -M 2
- คลิ๊ก Start เพื่อประมวลผล ทำการวิเคราะห์
- พบหน้า Classifier output แสดงผลการวิเคราะห์ ในรูป Decision tree
- มีค่าอื่น เช่น ค่าความถูกต้องในการทำนาย (Correctly Classified instances)
- ช่อง Result list ให้ Right click เลือก Visualize tree จะพบแผนภาพ
- ความหมายจากภาพ ถ้า rainy และ windy ก็ไม่ควรออกไปชม ทัศนียภาพ (outlook)
- ความหมายจากภาพ ถ้า มืดคลึ้ม (overcast)  ก็ไม่ได้ชม outlook
- ความหมายจากภาพ ถ้า sunny และ ความชื้นต่ำ (humidity) ก็ออกไปชม outlook ได้
ใส่ข้อมูลเข้าไป
แล้วแสดงผลการวิเคราะห์เป็น Tree (Visualize View)
Case #2 : Classify in Weka

พิมพ์ข้อมูล Data Set จากคลิ๊ปเวลา 6.40
hrv (num) คือ อัตราการผันแปรของการเต้นของหัวใจ
hr (num) คือ heartbeat per minute
dayid (num) คือ วันที่เก็บข้อมูล
sequenceid (nom) คือ ครั้งที่เก็บข้อมูล
patternsleep (nom) คือ irregular = เอาแน่เอานอนไม่ได้
hoursawake (num) คือ จำนวนที่ตื่นนอนจากการหลับครั้งสุดท้าย
healthgrade (nom) คือ ต่ำกว่า 70.0 จะเป็น 0 ไม่ต่ำกว่าเป็น 1
0 คือ เต้นช้า แสดงว่า หัวใจแข็งแรง

Weka tutorial
"Weka Data Mining Tutorial for First Time & Beginner Users"
by Brandon Weinberg
@ATTRIBUTE hrv REAL (Heart Rate Variability)
@ATTRIBUTE hr REAL
@ATTRIBUTE dayid REAL
@ATTRIBUTE sequenceid {1of4,2of4,3of4,4of4}
@ATTRIBUTE patternsleep {irregular,regular}
@ATTRIBUTE hoursawake REAL
@ATTRIBUTE healthgrade {,0,1}
+ my_first_arff_file.arff
ใส่ข้อมูลเข้าไป
วิเคราะห์ความสัมพันธ์ว่านำไปทำนาย จะ Correctly ไหม
แล้วแสดงผลการวิเคราะห์เป็น Tree (Visualize View)
    ขั้นตอนการใช้โปรแกรม
  1. เปิดโปรแกรม Weka
  2. คลิ๊กปุ่ม Explorer
  3. ใน Tab : Preprocess
  4. คลิ๊ก Open file เลือก my_first_arff_file.arff
  5. พบ Attributes มี 7 fields
    Default : hrv (คือ อัตราการผันแปรของการเต้นของหัวใจ)
    Minimum : 43.1
    Maximum : 84.1
    Mean : 67.791
    StdDev : 8.783
  6. คลิ๊ก Visualize All พบผลทั้ง 7 Fields
  7. คลิ๊ก Edit พบข้อมูล 80 instances เหมือนในคลิ๊ปเวลา 6.40
  8. เลือกวิเคราะห์ด้วย Tab Classify
    กำหนด Classifier เป็น Choose, functions, Logistic
    ได้ Logistic -R 1.0E-8 -M -1 -num-decimal-places 4
    การวิเคราะห์นี้ใช้กับข้อมูลที่เป็น Nominal แต่ใช้กับ Numeric ไม่ได้
    หากเลือก Numeric ปุ่ม start ก็จะเป็น disable
  9. กดปุ่ม Start เมื่อใช้ทั้ง 7 Fields
    พบ Correctly Classified Instances = 95% (76)
  10. กลับไป remove fields ที่ไม่เกี่ยว คือ hr, dayid, sequenceid, patternsleep
    เหลือเพียง hrv, hoursawake, healthgrade
    กดปุ่ม Start ใหม่ เมื่อใช้เพียง 3 Fields
    พบ Correctly Classified Instances = 98.75% (79)
  11. ผลการทดสอบความสัมพันธ์ของ 3 Fields พบว่า มีความถูกต้อง
    จาก healthgrade = 0 มี 45 รายการ
    จาก healthgrade = 1 มี 35 รายการ
    และดูที่ Confusion Matrix คือ การประเมินผลลัพธ์การทำนาย
  12. เปลี่ยนไปใช้ Tree ในการวิเคราะห์ข้อมูล
    เลือก Choose, Trees, J48
  13. กดปุ่ม Start ใหม่ เมื่อเลือก healthgrade
    พบ Correctly Classified Instances = 100% (80)
    และดูที่ Confusion Matrix คือ การประเมินผลลัพธ์การทำนาย
  14. Right click บน trees.J48
    เลือก Visualize tree พบ Tree view จำแนกข้อมูล ว่า
    hrv <= 69.5 ได้ healthgrade = 0 มี 44 รายการ
    hrv > 69.5 ได้ healthgrade = 1 มี 36 รายการ
  15. เปลี่ยนไปเลือก patternsleep ที่มีค่าเป็น {irregular,regular}
    Right click บน trees.J48 แล้วดู Visualize tree
    พบการเทียบ dateid กับ patternsleep อัตโนมัติ
    dateid <= 10 ได้ patternsleep = irregular มี 40 รายการ
    dateid > 10 ได้ patternsleep = regular มี 40 รายการ
  16. เปลี่ยนไปเลือก sequenceid ที่มีค่าเป็น {1of4,2of4,3of4,4of4}
    พบ Correctly Classified Instances = 86.25
    Right click บน trees.J48 แล้วดู Visualize tree
    พบการเทียบ hoursawake + dayid กับ sequenceid อัตโนมัติ
    ก็จะได้ tree ที่ซับซ้อน และอาจไม่แม่นยำที่จะนำไปใช้
คู่มือการใช้งาน Weka Explorer
คู่มือการใช้งาน Weka Explorer (ฉบับภาษาไทย)
โดย เอกสิทธิ์ พัชรวงศ์ศักดา หสม.ดาต้า คิวบ์
บทที่ 1 มาขุดเหมืองข้อมูลกันเถอะ
บทที่ 2 กระบวนการขุดเหมืองข้อมูล
บทที่ 3 มารู้จัก Weka กันเถอะ
บทที่ 4 การจัดการกับข้อมูลให้อยู่หมัด
บทที่ 5 วันนี้ฝนน่าจะตก
บทที่ 6 คุณอยู่กลุ่มไหน
บทที่ 7 รับขนมจีบ ซาลาเปา เพิ่มไหมครับ
Sample : Weka Data Sets Sample Weka Data Sets
Below are some sample WEKA data sets, in arff format.
http://storm.cis.fordham.edu/~gweiss/data-mining/datasets.html
+ contact-lens.arff
+ cpu.arff
+ cpu.with-vendor.arff
+ diabetes.arff
+ glass.arff
+ ionospehre.arff
+ iris.arff
+ labor.arff
+ ReutersCorn-train.arff
+ ReutersCorn-test.arff
+ ReutersGrain-train.arff
+ ReutersGrain-test.arff
+ segment-challenge.arff
+ segment-test.arff
+ soybean.arff
+ supermarket.arff
+ vote.arff
+ weather.arff
+ weather.nominal.arff
รวมคู่มือ (Handbooks) คู่มือสอนใช้ Weka โดย รศ.วิชุดา ไชยศิวามงคล - 15 หน้า
คู่มือสอนใช้ Weka โดย Remco R. Bouckaert, Eibe Frank, and team - 303 หน้า

http://goo.gl/72BPC