การอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, and Hadoop
From Business Intelligence to Data Science
19 - 24 พฤศจิกายน 2561





 
   สมาคมศูนย์วิชาการไทย – ออสเตรเลีย ซึ่งได้ก่อตั้งขึ้นในประเทศไทยมากว่า 30 ปี  เป็นองค์กรที่ไม่แสวงหาผลกำไร และมีความร่วมมือกับหน่วยงานต่าง ๆ ในการจัดกิจกรรมการสัมมนา/อบรมเชิงปฏิบัติการทางวิชาการต่างๆ  ได้จัดอบรมเชิงปฏิบัติการเกี่ยวกับ Business Intelligence โดยใช้ Open Source Pentaho Business Analytic Platform  ขึ้นปีที่ 8 แล้ว  โดยคณะวิทยากรผู้เชี่ยวชาญ นำโดย ผศ. ดร. สุณี รักษาเกียรติศักดิ์ ศิษย์เก่าออสเตรเลีย  โดยได้จัดโครงการอบรมครั้งแรกในรุ่นที่ 1 ในวันที่ 18-20 กุมภาพันธ์ 2554 (2011) และได้รับการตอบรับอย่างดีจากหน่วยงานต่าง ๆ ทั้งภาครัฐ เอกชน และสถาบันการศึกษา สมาคมฯ ได้จัดต่อเนื่องมาจนปัจจุบัน โดยได้มีการปรับเนื้อหาหลักสูตรตามความก้าวหน้าของเทคโนโลยี จาก Business Intelligence to Data Science โดยจัดปีละ 2 ครั้งเท่านั้น ในการจัดทุกครั้งได้รับการตอบรับเป็นอย่างดีมาก
 
   ใน 2-3 ปีที่ผ่านมา ผู้คนให้ความสนใจเกี่ยวกับ Data Science, Big data กันมาก องค์กรใหญ่ๆ ในภาคเอกชนเริ่มมีตำแหน่งงานเกี่ยวกับ Data Science, Big data และภาคการศึกษาเริ่มมีการพัฒนาหลักสูตรเกี่ยวกับ Data Science และ Big data กันมากขึ้น เพื่อสนองตอบนโยบายของรัฐเกี่ยวกับ Big data 
 
   สมาคมฯ ได้พัฒนาหลักสูตรการวิเคราะห์ข้อมูล (Data Analytics) มาตั้งแต่การพัฒนาระบบ Business Intelligence ซึ่งจำเป็นสำหรับการวิเคราะห์ข้อมูลทางธุรกิจขององค์กรแบบอัตโนมัติเพื่อสนับสนุนการบริหารและการตัดสินใจ ซึ่งข้อมูลส่วนใหญ่มาจากฐานข้อมูลเชิงสัมพันธ์ (Relational Database) ที่เกิดจากธุรกรรม (transaction) ขององค์กร ที่เรียกว่า Operational Database ซึ่งเป็นข้อมูลเชิงโครงสร้าง (structured) โดยมีการออกแบบ Data Model (Multidimensional data modelling) สำหรับสร้างฐานข้อมูลที่พร้อมจะวิเคราะห์ซึ่งจะอยู่ในฐานข้อมูลเดียวที่เรียกว่าคลังข้อมูล Data warehouse หรือคลังข้อมูลย่อย Data mart ก็ได้ โดยมี Business Intelligence Platform (software) เช่น Pentaho Business Analytics Suite เป็นระบบจัดการที่ครบวงจร ตั้งแต่ Data Engineering, Data Analysis & Modelling, Data Visualization จนขยายขอบเขตการอบรมไปถึง Data Science วิทยาการข้อมูลที่ขยายขอบเขตที่กว้างขวางขึ้น มีการวิเคราะห์ข้อมูลขนาดใหญ่ (big data): 3V คือ ข้อมูลจำนวนมหาศาล (volume), เกิดขึ้นอย่างรวดเร็ว (velocity), ในหลากหลายรูปแบบ (variety) ซึ่งเป็นข้อมูล unstructured เช่น ข้อมูลในเว็บ, social media, IOT (Internet Of Things) เป็นต้น โดยใช้เทคโนโลยีการจัดเก็บและประมวลผลแบบกระจาย เช่น Hadoop (HDFS, Map-Reduce) 
 
   การอบรมนี้จะเน้นปฏิบัติการจากโจทย์จริง ข้อมูลจริงหรือใกล้เคียงของจริง และ Solution จริง ผู้เข้าอบรมจะมีประสบการณ์และเห็นภาพใหญ่ของกระบวนการพัฒนาระบบ ทำให้สามารถจะเริ่มงานจริงของหน่วยงานได้ โดยไม่มีค่าใช้จ่ายด้านซอฟต์แวร์ เนื่องด้วยซอฟต์แวร์ที่ใช้เป็น software free ทั้งหมด 
 
   การอบรมจะจัดขึ้นในวันจันทร์ - เสาร์ ที่ 19 -  24  พฤศจิกายน 2561 ณ ห้อง Orchid 4  ชั้น 11 โรงแรม Jasmine  สุขุมวิท 23 กรุงเทพฯ (BTS สถานีอโศก หรือ MRT สถานีสุขุมวิท)  โทร.  02-204-5885 
ผู้สนใจสามารถดูรายละเอียดและสมัครได้ที่เว็บสมาคมฯ www. tatsc.or.th  
 
ซอฟต์แวร์หลักที่ใช้ในการอบรม
1. Pentaho BI Suite (https://www.hitachivantara.com/go/pentaho.html
เป็น Open Source BI Application Software ที่ใช้ Java technology และเป็นที่สนใจอย่างกว้างขวาง หลังจากได้รับรางวัล Bossie Awards 2010: The best open source applications โดย Pentaho ได้มีการพัฒนาชุดซอฟต์แวร์นี้เชิงรุกอย่างต่อเนื่อง  และได้มีการจัดประชุม Pentaho World เป็นประจำทุกปี (https://www.pentahoworld.com/)  
จุดเด่นอีกประการหนึ่งของ Pentaho Business Analytic Platform คือ รองรับการทำงานกับข้อมูลที่หลากหลาย ทั้งฐานข้อมูล NOSQL การประมวลผล big data ด้วย Hadoop และการวิเคราะห์ข้อมูลด้วย Weka, R, และ Spark  อีกทั้งเป็นระบบ Open Source ที่ติดตั้งง่าย ใช้งานง่าย มีทั้งระบบที่เป็น  Community Edition (Pentaho CE) ซึ่งไม่มีค่าใช้จ่ายด้านซอฟต์แวร์ และระบบ Enterprise Edition (Pentaho EE) ซึ่งเพิ่ม features ต่างๆ มากขึ้นจากระบบ Community Edition
 
2. Postgres (https://www.postgresql.org/) THE WORLD'S MOST ADVANCED OPEN SOURCE RELATIONAL DATABASE 

3. Weka (https://www.cs.waikato.ac.nz/ml/weka/)  Open source software ในการทำ data mining และสามารถ deploy model อัตโนมัติผ่าน Pentaho Data Integration โดยไม่ต้องเขียนโปรแกรม

4. R (https://www.r-project.org/) สำหรับการทำ Exploratory Data Analysis & Modelling โดยไม่ต้องเขียน code แต่เรียกใช้เมนู R-Commander (เหมือนเมนู SPSS) ในการวิเคราะห์ และเรียนรู้คำสั่ง R จาก R-Commander
  
5. Cloudera Hadoop (https://www.cloudera.com/products/open-source/apache-hadoop.html) และ Pentaho-Hadoop ผ่าน Pentaho Data Integration

6. Power BI (https://powerbi.microsoft.com/)  เสริม สำหรับ Visualization
 
เนื้อหาหลักสูตรที่เปิดอบรม
ในการอบรมนี้ผู้อบรมจะมีประสบการณ์ในการพัฒนาระบบสอดคล้องกับ Gartner Analytic Value Escalator โดยแบ่งเป็น 3 โมดูล ๆ ละ 2 วัน


 
โมดูล 1: Descriptive Analytics with Pentaho Business Intelligence 
(อบรมวันจันทร์-อังคารที่ 19 – 20 พฤศจิกายน 2561)  
ปูพื้นฐานหลักของการพัฒนาระบบ Business Intelligence เป็นการนำเสนอข้อมูลแบบ Descriptive อัตโนมัติ โดยใช้เครื่องมือหลัก 3 ตัว คือ Schema Workbench สำหรับสร้าง OLAP Cube, Data Integration สำหรับทำ ETL (Extract Transform and Load), และ Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard เป็นการจัดการและวิเคราะห์ข้อมูลแบบอัตโนมัติระดับ Descriptive Analytics ซึ่งใช้มากในองค์กร

โมดูล 2: Diagnostic, Predictive, and Prescriptive Analytics 
(อบรมวันพุธ-พฤหัสที่ 21-22 พฤศจิกายน 2561)
นำเสนอการจัดการข้อมูล การวิเคราะห์ข้อมูล ของ Use case จริง 2 Use cases 
วันที่ 1  eLearning Use case
ปฏิบัติการกรณีศึกษาการพัฒนาระบบ BI จากโจทย์งานวิจัย “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor”  ที่  http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846  จาก data source ที่เป็น OLTP Relational Database ซึ่งยังไม่เป็นระบบอัตโนมัติ  ให้เป็นระบบ BI อัตโนมัติ ด้วย Pentaho ทำ data mining โดยใช้ Weka และ deploy model โดยใช้ Pentaho Weka Scoring Plugin Data Science Pack ของ Pentaho  ในการอบรม Use case นี้จะเห็นตั้งแต่ Descriptive Analytics, Predictive Analytics และ Prescriptive Analytics (การนำโมเดลไปใช้) 
วันที่ 2: IOT Use case 
ปฏิบัติการกรณีศึกษาการวิเคราะห์ข้อมูลจริง (use case) จาก IOT Sensors วัดคุณภาพอากาศ (https://canarin.net/seahazemon/) จากโครงการวิจัยของ intERLab AIT (https://interlab.ait.ac.th/cwmn/index.php) การจัดการข้อมูล การวิเคราะห์สถิติสำหรับการทำ Exploratory Data Analysis, Time Series, Modelling ด้วย Regression, Linear Model, Neural Net ด้วยโปรแกรม R, Weka, Pentaho, และเสริม visualization ด้วย Power BI  

โมดูล 3: Big Data Analytics with Pentaho Hadoop 
(อบรมวันศุกร์ – เสาร์ ที่ 23 – 24 พฤศจิกายน 2561) 
หลักสูตรนี้เหมาะสำหรับนักไอทีที่สนใจเป็น Data Scientist, Data Engineer และ Computer System Engineer 
(ใช้ OS Linux บน Virtual Machine) 
วันที่ 1  การวิเคราะห์ big data ด้วย Hadoop และ Pentaho-Hadoop ด้วยโจทย์ข้อมูลของ Web log  โดยใช้ Pentaho Data Integration ซึ่งไม่ต้องเขียน JAVA Map-Reduce และการนำเสนอผลการวิเคราะห์ใน Pentaho OLAP Cube, การใช้งาน Hive และ HBase  โดยใช้ Virtual Machine ที่ติดตั้ง CentOS, JAVA, PostgreSQL, Pentaho CE, Hadoop (version 1) เรียบร้อยแล้ว เน้นการใช้งานสำหรับ Data Scientist
วันที่ 2: การติดตั้ง Hadoop Cluster (Hadoop version 2) ด้วย Cloudera และทดสอบการใช้งาน 
การ run WordCount ด้วย Java Map-Reduce การวิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem เช่น Hive การใช้งาน Pentaho ร่วมกับ Hadoop, Hive การใช้งาน Hue – Web UI 


หมายเหตุ  ผู้เข้าอบรมไม่ต้องเขียน code ใด ๆ ในการวิเคราะห์ข้อมูล เหมาะสำหรับนักไอทีและผู้ที่สนใจการวิเคราะห์ข้อมูลทางธุรกิจ เพื่อสร้างทักษะการทำงานด้าน Data Analyst, Data Scientist, Data Engineer 
สามารถดูรายละเอียดกำหนดการอบรมและเอกสารอบรมได้ที่เว็บสมาคม www.tatsc.or.th 

วัตถุประสงค์ 
เพื่อให้ผู้เข้าอบรมได้รับความรู้และความเข้าใจถึงหลักการของระบบ BI และการวิเคราะห์ข้อมูล
เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการในกระบวนการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการวิเคราะห์ข้อมูลด้วยทั้งวิธีการทางสถิติและวิธีการทำเหมืองข้อมูลเพื่อให้ได้โมเดลพยากรณ์ และการนำโมเดลไปใช้
เพื่อให้เข้าอบรมได้เข้าใจหลักการและปฏิบัติการวิเคราะห์ข้อมูลขนาดใหญ่ (big data) พร้อมติดตั้งซอฟต์แวร์ในส่วนต่าง ๆ 
เพื่อให้ผู้เข้าอบรมสามารถนำซอฟต์แวร์ Open Source Pentaho BI Suite, Weka, R, Hadoop,   ไปประยุกต์ใช้งานได้
เพื่อสร้างเครือข่ายผู้ใช้งานที่จะร่วมมือ แลกเปลี่ยน และช่วยเหลือซึ่งกันและกัน 
(ผู้ที่ผ่านการอบรมกับสมาคมแล้ว จะได้รับทราบข้อมูลกิจกรรมที่สมาคมจัด และ
ทีมวิทยากรและผู้ช่วยยินดีให้คำปรึกษาในการเริ่มโครงการ) 
 
หลักสูตรนี้เหมาะสำหรับ 
ผู้ที่ต้องการเรียนรู้หลักและวิธีการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
ผู้ที่ต้องการเรียนรู้หลักการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
นักไอทีหรือผู้สอนไอที นักสถิติ และนักธุรกิจที่สนใจไอที
ผู้บริหาร เจ้าของหน่วยงาน เจ้าหน้าที่วางแผนเชิงกลยุทธ์ ติดตามนโยบายขององค์กร 
 
จำนวนรับเข้าอบรมและคุณสมบัติของผู้เข้าอบรม   :  
รับจำนวนจำกัด  โมดูลละ 30 คน  
โดย ผู้สมัครต้องนำคอมพิวเตอร์โน้ตบุคของตนเองมา ซึ่งต้องมีคุณสมบัติดังนี้
 
RAM: at least 8 GB
Hard drive space: at least 30 GB free space
Processor: at least Core i5 
OS: Windows7 or higher 64 bits
 
หมายเหตุ  หาก spec.เครื่องต่ำกว่านี้ ทางสมาคมมีชุดซอฟต์แวร์และ solution ของ version เก่าในการอบรมครั้งก่อนให้ใช้ได้ 
 
วิธีการอบรม
   บรรยายภาพรวมของทฤษฎีและหลักการที่เกี่ยวข้อง สำหรับภาคปฏิบัติการวิทยากรจะสาธิตตามเอกสารอบรม Step by step  และให้ผู้เข้าอบรมปฏิบัติตาม (เน้นปฏิบัติการเพื่อให้ได้ Solution ที่ใช้งานได้จริง)
   โจทย์ที่ใช้ปฏิบัติการจะเป็นตัวอย่างและข้อมูลที่ต่อเนื่องกัน (อบรมแบบ Problem based) 
 
ค่าสมัครในการอบรม
   ค่าลงทะเบียน ซึ่งจะมีเอกสารการอบรม  ซอฟต์แวร์ที่ใช้อบรมทั้งหมด ได้แก่  Pentaho BI Suite ทั้ง Enterprise Edition และ Community Edition, Java, PostgreSQL, Weka, R, Cloudera Hadoop และ Utilities อื่น ๆ ที่จำเป็น  พร้อมกระเป๋าเอกสารมอบให้ และรวมอาหารกลางวัน & อาหารว่าง  เช้า-บ่าย ทุกวันอบรม
   หนึ่งโมดูล (2 วัน): คนละ 8,500 บาท 
   สองโมดูล (4 วัน): คนละ 15,500 บาท 
   สามโมดูล (6 วัน): คนละ 22,000 บาท 
แนะนำ: ในการอบรมที่ผ่านมาผู้อบรมส่วนใหญ่จะสมัครมา 6 วัน จะได้ประโยชน์สูงสุด เพราะเนื้อหาและวิธีการมีความต่อเนื่องในระดับหนึ่ง ผู้ที่ไม่สามารถมาได้ทั้ง 6 วันก็สามารถเลือกสมัครโมดูลที่สนใจได้ 

Promotion พิเศษ: สมัครและชำระค่าอบรมภายในวันที่  9 พฤศจิกายน 2561 
1. ได้ส่วนลดพิเศษ 10% สำหรับบุคคลทั่วไป
2. ได้ส่วนลดพิเศษ 20% สำหรับ
   ก. ผู้ที่เคยเข้าอบรมกับสมาคมแล้วในการจัดการอบรมที่ผ่านมาของสมาคมฯ
   ข. เป็นสมาชิกสมาคม  
   ค. เป็นนิสิตนักศึกษาที่กำลังเรียนอยู่ หรืออาจารย์มหาวิทยาลัยที่สอนอยู่
หนึ่งโมดูล (2 วัน): คนละ 8,500 บาท  (ส่วนลด 10% เหลือ 7,650, 20% เหลือ 6,800)
สองโมดูล (4 วัน): คนละ 15,500 บาท (ส่วนลด 10% เหลือ 13,950, 20% เหลือ 12,400)
สามโมดูล (6 วัน): คนละ 22,000 บาท (ส่วนลด 10% เหลือ 19,800, 20% เหลือ 17,600)
 
หมายเหตุ ราคานี้เป็นราคาสุทธิแล้ว (เนื่องจากสมาคมฯ ไม่อยู่ในเงื่อนไขที่ต้องจดทะเบียนภาษีมูลค่าเพิ่ม)
 
การสมัครเข้าอบรม
โปรดกรอกรายละเอียดของผู้เข้าอบรมที่เว็บสมาคม www.tatsc.or.th  เพื่อสำรองที่นั่ง 
ชำระค่าสมัครโดยจ่ายเข้า บัญชีธนาคารของสมาคม ดังนี้:
 

ธนาคารกรุงเทพ สาขาจามจุรี สแควร์   บัญชีเงินฝากสะสมทรัพย์ เลขที่: 939-0-14153-0

ชื่อบัญชี: สมาคม ศูนย์วิชาการไทย-ออสเตรเลีย

และส่งสำเนา Pay-in slip มาทาง e-mail:   This email address is being protected from spambots. You need JavaScript enabled to view it.
เมื่อทางสมาคมได้รับเอกสารแล้วจะตอบกลับทาง e-mail  
 
อนึ่ง สำหรับผู้เข้าอบรมที่ต้องหักภาษี ณ ที่จ่าย  โปรดออกเอกสารการหักภาษี ณ ที่จ่ายตามรายละเอียดดังนี้ สมาคมศูนย์วิชาการไทย-ออสเตรเลีย  เลขประจำตัวผู้เสียภาษี 0993-000-178998 
ที่อยู่  968  ชั้น  9  อาคารอื้อจือเหลียง ถนนพระราม 4  แขวงสีลม เขตบางรัก กรุงเทพมหานคร 10500
 
หมายเหตุ : 
1)  สมาคมขอสงวนสิทธิ์ที่จะยกเลิกการอบรมในกรณีที่มีเหตุขัดข้องสุดวิสัย โดยทางสมาคมฯ จะโอนเงินคืนให้ท่านในกรณีที่ท่านได้มีการชำระมาก่อนล่วงหน้า
2)  สมาคมขออนุญาตที่จะออกใบเสร็จรับเงินให้กับผู้อบรมในวันอบรม และขอให้ผู้ที่หักภาษี ณ ที่จ่ายนำเอกสารการหักภาษี ณ ที่จ่าย มาให้ในวันอบรมด้วย
3) หากมีข้อสงสัยประการใด โปรดติดต่อสมาคมที่ e-mail:  This email address is being protected from spambots. You need JavaScript enabled to view it.   
หรือที่ ผศ.ดร.สุณี  รักษาเกียรติศักดิ์  089-211-6224 หรือ นางสาววนิดา แซ่ตั้ง 094-524-1559
 
กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, and Hadoop
From Business Intelligence to Data Science
 
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ 
 
โมดูล 1: Descriptive Analytics with Pentaho Business Analytics Platform
 
วันจันทร์ที่ 19 พฤศจิกายน 2561 
 
08:00 08:45 น.
ลงทะเบียนสำหรับ โมดูล 1
09:00 10:10 น.
หัวข้อที่ 1: แนวคิด หลักการ และประโยชน์ ของ “Business Intelligence”
ภาพรวมของระบบ Pentaho Business Intelligence (Pentaho BI)
ติดตั้งระบบ Pentaho Community Edition (Pentaho CE)
(ติดตั้ง Java, ฐานข้อมูล PostgreSQL, Pentaho CE, Design-Tools)
10:10 10:30 น.
หยุดพักรับประทานอาหารว่าง 
10:30 12:00 น.
หัวข้อที่ 2: โจทย์สำหรับทำ BI: 
กรณีศึกษาของระบบงานบุคคล (Human Resource) 
การออกแบบ Data Model 
การนำข้อมูลสำหรับการวิเคราะห์ (ที่ ETL แล้ว) เข้าฐานข้อมูล Postgres 
12:00 13:00 น.
หยุดพักรับประทานอาหารกลางวัน
13:00 14:00 น.
หัวข้อที่ 3: ทดลองใช้ระบบในฐานะผู้ใช้ (Users)  
Reporting, Analysis (OLAP Cube), Dashboard
14:00 15:00 น.
หัวข้อที่ 4: หลักการและปฏิบัติการ: การใช้ Schema Workbench สำหรับสร้าง OLAP Cube
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00 15:20 น.
หยุดพักรับประทานอาหารว่าง
15:20 17:00 น.
หัวข้อที่ 4: หลักการและปฏิบัติการ: การใช้ Schema Workbench (ต่อ)
วันอังคารที่ 20 พฤศจิกายน 2561 
 
09:00 - 10:10 น.
หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
10:10 –  10:30 น.
หยุดพักรับประทานอาหารว่าง
10:30 12:00 น.
หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE)  (ต่อ)
12:00 13:00 น.
หยุดพักรับประทานอาหารกลางวัน
13:00 15:00 น.
หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration 
สำหรับจัดเตรียมข้อมูลสำหรับการวิเคราะห์ Extract Transform & Load (ETL)
15:00 15:20 น.
หยุดพักรับประทานอาหารว่าง
15:20 –  16:30 น.
การวิเคราะห์ ออกแบบ และพัฒนาระบบ BI: 
กรณีศึกษาการใช้งานทรัพยากรห้องสมุดระดับหลักสูตร และ
Show Case Pentaho BI ของระบบ Logistics
ว่าที่ ร้อยตรี.สะอาด  สืบสมาน (ผู้เข้าอบรมเมื่อ มิถุนายน 2559)
16:30 17:00 น.
- แจกประกาศนียบัตร
สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม

กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, and Hadoop
From Business Intelligence to Data Science
 
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ 
 
โมดูล 2: Diagnostic, Predictive, and Prescriptive Analytics
 
วันพุธที่ 21 พฤศจิกายน 2561  โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
Use case: ATutor eLearning  
 
08:00 – 08:45 น.
ลงทะเบียน สำหรับ โมดูล 2
09:00  - 09:30 น.
ติดตั้ง PentahoEE 
09:30  – 10:10 น.
หัวข้อที่ 1: โจทย์สำหรับทำ BI “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor” ที่ http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846
- ออกแบบ Data model สำหรับการวิเคราะห์
- นำข้อมูล ATutor_wh (ที่ ETL แล้ว) เข้าฐานข้อมูล PostgreSQL 
- ทดสอบ ATutor Pentaho Solutions: Report, Cube, Dashboard as Descriptive
10:10  – 10:30 น.
รับประทานอาหารว่าง 
10:30  – 12:00 น.
หัวข้อที่ 1: กรณีศึกษา ATutor (ต่อ)
12:00  – 13:00 น.
รับประทานอาหารกลางวัน
13:00  – 15:00 น.
หัวข้อที่ 2: การทำเหมืองข้อมูลด้วย Weka:
Classification, Prediction, Association, Clustering  
15:00  – 15:20 น.
รับประทานอาหารว่าง
15:20  – 17:00 น.
หัวข้อที่ 3: ทดลอง run Data Mining: Clustering Predictive Model และ
นำ Model ไปใช้กับข้อมูลชุดใหม่ (Prescriptive)
วันพฤหัสที่  22  พฤศจิกายน 2561  โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
Use case: IOT Sensors วัดคุณภาพอากาศ (https://canarin.net/seah zemon/
จากโครงการวิจัยของ intERLab AIT (https://interlab.ait.ac.th/cwmn/index.php) ร่วมกับ LIP6, UPMC, France
 
09:00  – 09:45 น.
เตรียมความพร้อม: ติดตั้งโปรแกรม R, Weka, PentahoCE
09:45  – 10:15 น.
หัวข้อที่ 4: Data Manipulation and Exploration (with R and Pentaho)
10:15  – 10:30 น.
รับประทานอาหารว่าง
10:30  – 12:00 น.
หัวข้อที่ 4: Data Manipulation and Exploration (ต่อ)
12:00  – 13:00 น.
รับประทานอาหารกลางวัน
13:00  – 15:00 น.
หัวข้อที่ 5: Data Modelling with R and Weka 
(Regression, Time Series, Linear Model, Neural Net) 
15:00  – 15:20 น.
รับประทานอาหารว่าง
15:20  – 17:00 น.
หัวข้อที่ 6: Data Visualization ด้วย Power BI
- แจกประกาศนียบัตร
สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
 
กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, and Hadoop
From Business Intelligence to Data Science
 
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ 
 
โมดูล 3: Big Data Analytics with Pentaho Hadoop
 
วันศุกร์ที่ 23 พฤศจิกายน 2561   
 
08:00 – 08:45 น.
ลงทะเบียน สำหรับ โมดูล 3
09:00  – 10:10 น.
หัวข้อที่ 1: แนวคิดและหลักการของการวิเคราะห์ big data ด้วย Hadoop และ
Pentaho-Hadoop (Pentaho Data Science Pack)
10:10  – 10:30 น.
รับประทานอาหารว่าง
10:30  – 12:00 น.
หัวข้อที่ 2: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop 
12:00  – 13:00 น.
รับประทานอาหารกลางวัน
13:00  – 15:00 น.
หัวข้อที่ 3: การใช้งาน Hive, Hbase
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00  – 15:20 น.
รับประทานอาหารว่าง
15:20  – 17:00 น.
หัวข้อที่ 4: การสร้าง Transformation ของการวิเคราะห์ Web log ด้วย Pentaho-Hadoop 
 
วันเสาร์ที่ 24  พฤศจิกายน 2561   โดย คุณกิตติรักษ์ ม่วงมิ่งสุข (Cluster Kit)  และคณะ
 
09:00  – 10:10 น.
หัวข้อที่ 5: Cloudera Hadoop Cluster และ Pentaho-Hadoop
- การติดตั้ง Cloudera Hadoop Cluster และทดสอบการใช้งาน
10:10  – 10:30 น.
รับประทานอาหารว่าง
10:30  – 12.00 น.
หัวข้อที่ 6: การ run WordCount ด้วย Java Map-Reduce
12:00  – 13.00 น.
รับประทานอาหารกลางวัน
13:00  – 15.00 น.
หัวข้อที่ 7: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster
15:00  – 15:20 น.
รับประทานอาหารว่าง
15:20  – 17:00 น.
หัวข้อที่ 8: การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem
- แจกประกาศนียบัตร
สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม