การอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, and Hadoop
From Business Intelligence to Data Science
25 - 30 มิถุนายน 2561





 
   สมาคมศูนย์วิชาการไทย – ออสเตรเลีย ซึ่งได้ก่อตั้งขึ้นในประเทศไทยมากว่า 30 ปี  เป็นองค์กรที่ไม่แสวงหาผลกำไร และมีความร่วมมือกับหน่วยงานต่าง ๆ ในการจัดกิจกรรมการสัมมนา/อบรมเชิงปฏิบัติการทางวิชาการต่างๆ  ได้จัดอบรมเชิงปฏิบัติการเกี่ยวกับ Business Intelligence โดยใช้ Open Source Pentaho Business Analytic Platform  ขึ้นปีที่ 8 แล้ว  โดยคณะวิทยากรผู้เชี่ยวชาญ นำโดย ผศ. ดร. สุณี รักษาเกียรติศักดิ์ ศิษย์เก่าออสเตรเลีย  โดยได้จัดโครงการอบรมครั้งแรกในรุ่นที่ 1 ในวันที่ 18-20 กุมภาพันธ์ 2554 (2011) และได้รับการตอบรับอย่างดีจากหน่วยงานต่าง ๆ ทั้งภาครัฐ เอกชน และสถาบันการศึกษา สมาคมฯ ได้จัดต่อเนื่องมาจนปัจจุบัน โดยได้มีการปรับเนื้อหาหลักสูตรตามความก้าวหน้าของเทคโนโลยี และเพิ่มเนื้อหาเข้มข้นมากขึ้นจากการศึกษาเพิ่มเติมอย่างต่อเนื่อง โดยจัดปีละ 2 ครั้งเท่านั้น ในการจัดทุกครั้งได้รับการตอบรับเป็นอย่างดีมาก 
 
   ในการอบรมแต่ละครั้งจะใช้ซอฟต์แวร์ version ล่าสุด และจะมีเนื้อหาใหม่ในแต่ละรอบที่จัด  ครั้งนี้ จัด 2 หลักสูตร เช่นเดิม โดยเน้นเนื้อหาหลักที่จำเป็นและเนื้อหาใหม่ ๆ (เนื่องด้วยเนื้อหาส่วนใหญ่ได้มีการจัดทำวีดีทัศน์เพื่อให้เผยแพร่แล้ว โดยไม่มีค่าใช้จ่ายที่ http://ddeclass.com/vcatalog/126) ได้แก่
 
หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science
เป็นการปูพื้นฐานการวิเคราะห์ข้อมูลหลักด้วย Descriptive Modeling แต่เป็นการนำเสนอผลลัพธ์ของการวิเคราะห์แบบอัตโนมัติในรูปแบบของ Report, Analysis OLAP Cube, และ Dashboard ด้วย Pentaho BI ซึ่งเป็นจุดเริ่มต้นของการพัฒนาระบบ Business Intelligence และขยายจาก Descriptive เป็น Predictive Modeling ด้วยการทำ Data Mining โดยใช้ Weka และการ deploy Model ไปใช้กับข้อมูลชุดใหม่ (Prescriptive) แบบอัตโนมัติโดยไม่ต้องเขียนโปรแกรม โดยใช้ Pentaho Data Science Pack API
 
หลักสูตร 2: Big Data Analytics with Pentaho Hadoop and IOT Use case
เป็นการปูพื้นฐานการวิเคราะห์ข้อมูลขนาดใหญ่ (big data) ด้วย Pentaho-Hadoop (Hadoop version 1) เพื่อให้นักวิเคราะห์ข้อมูลเข้าใจหลักการประมวลผล big data โดยนักวิเคราะห์ไม่ต้องเขียนโปรแกรมภาษา JAVA สำหรับการวิเคราะห์ด้วย Map-Reduce แต่ Pentaho จะมี Data Science Pack ซึ่งเป็น JAVA API อำนวยความสะดวกให้, 
 
การติดตั้งและประมวลผล big data ด้วย Cloudera Hadoop Cluster, Hive, เครื่องมือตัวอื่น ๆ ของ Hadoop Ecosystem, การใช้งาน Pentaho-Hadoop กับ Cloudera Cluster, และเนื้อหาใหม่
 
ปฏิบัติการกรณีศึกษาการวิเคราะห์ข้อมูลจริง (use case) จาก IOT Sensors วัดคุณภาพอากาศ (https://canarin.net/seahazemon/) จากโครงการวิจัยของ intERLab AIT  (https://interlab.ait.ac.th/cwmn/index.php) ร่วมกับ LIP6, UPMC, France 
 
   การอบรมจะจัดขึ้นในวันจันทร์ - เสาร์ ที่ 25 -  30 มิถุนายน 2561 ณ ห้อง Grand Lily ชั้น L โรงแรม Jasmine  สุขุมวิท 23 กรุงเทพฯ (BTS สถานีอโศก หรือ MRT สถานีสุขุมวิท)  โทร.  02-204-5885 
ผู้สนใจสามารถดูรายละเอียดและสมัครได้ที่เว็บสมาคมฯ www. tatsc.or.th  
 
หลักการและเหตุผล
   ในการดำเนินธุรกิจขององค์กรจำเป็นต้องอาศัยระบบไอทีอย่างหลีกเลี่ยงไม่ได้ ผลจากการใช้งาน/การประมวลผลรายการ (operational transaction processing) ของระบบไอทีทำให้เกิดระบบฐานข้อมูลขนาดใหญ่ขององค์กร ซึ่งนับเป็นสินทรัพย์อันมีค่าขององค์กร แต่เป็นที่น่าเสียดาย ที่ข้อมูลมากมายที่อยู่ในฐานข้อมูลไม่สามารถนำมาใช้ประโยชน์ ในเชิงวิเคราะห์ เปรียบเทียบ หรือสร้างความรู้เกี่ยวกับการดำเนินธุรกิจขององค์กร เพื่อสนับสนุนการวางแผนเชิงกลยุทธ์ และการตัดสินใจ ของผู้บริหาร ได้อย่างมีประสิทธิภาพ ถึงแม้องค์กรจะได้ทุ่มงบประมาณมากมายในการได้มาซึ่งระบบไอทีเหล่านั้นก็ตาม และการได้มาซึ่งระบบไอทีแต่ละระบบก็อาจจะได้มาต่างเวลากันด้วยเครื่องมือหรือฐานข้อมูลในการจัดเก็บที่ต่างกัน ซึ่งก็เป็นธรรมชาติของการดำเนินการทางธุรกิจอันหลีกเลี่ยงไม่ได้ที่จะเกิดระบบงานใหม่ ๆ และข้อมูลใหม่ ๆ เกิดขึ้นอยู่ตลอดเวลา
   นอกจากนั้นแล้วข้อมูลเป็นจำนวนมากที่อยู่ในองค์กรก็ไม่ได้จัดเก็บในระบบฐานข้อมูลอย่างเดียว อาจจะจัดเก็บในแผ่นตารางทำการ (Spread Sheet เช่น Excel) หรือแม้แต่ข้อมูลที่เกิดขึ้นเป็นจำนวนมากจากอุปกรณ์ sensor ต่าง ๆ ในองค์กร ข้อมูลใน Weblog ของระบบคอมพิวเตอร์ขององค์กร ข้อมูลใน Social media ต่าง ๆ ที่เกี่ยวข้องกับองค์กร ซึ่งเรารู้จักกันในหัวข้อ “Big data” ซึ่งมีคุณสมบัติ 3V คือมีขนาดใหญ่ (Volume) เกิดขึ้นอย่างรวดเร็ว (Velocity) และมีรูปแบบที่หลากหลาย (Variety)  โดยข้อมูลเหล่านี้จะถูกจัดเก็บและประมวลผลด้วยรูปแบบใหม่ ซึ่งเป็นการประมวลผลแบบกระจาย (distributed)  ใช้ฐานข้อมูลแบบ NOSQL แทนฐานข้อมูลแบบสัมพันธ์ (Relational Database) เราจะจัดการและวิเคราะห์ข้อมูลเหล่านี้อย่างไร?  
   เนื่องด้วยสารสนเทศหรือความรู้เกี่ยวกับการดำเนินธุรกิจที่จำเป็นต้องใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจต้องมาจากข้อมูลหลายแหล่ง และต้องได้มาในเวลาอันรวดเร็ว ในรูปแบบที่ผู้บริหารเข้าใจได้ง่าย และสามารถดูสารสนเทศที่ต้องการได้หลายมุมมองตามความต้องการ และดูข้อมูลย้อนหลังได้สำหรับการวิเคราะห์ เปรียบเทียบ ซึ่งสารสนเทศที่เกิดจากระบบไอทีแต่ละระบบไม่สามารถตอบโจทย์ได้  ดังนั้นองค์กรจึงมีความจำเป็นต้องพัฒนาระบบคลังข้อมูล (data warehouse)  และพัฒนาระบบสารสนเทศอัจฉริยะทางธุรกิจ (Business Intelligence หรือ BI) เพื่อให้ได้สารสนเทศแบบอัตโนมัติที่ผู้บริหารระดับสูงใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจ
 
การพัฒนาระบบ BI ให้ประสบความสำเร็จจำเป็นต้องมีทีมพัฒนาจาก 3 กลุ่มคือ 
1) ผู้ดูแลฐานข้อมูล หรือ DBA
2) นักวิเคราะห์ข้อมูล หรือ Data Analyst และ   
3) นักวิเคราะห์ธุรกิจ หรือ Business Analyst
และที่จำเป็นอย่างยิ่งคือต้องมี Application Software ที่ใช้งานง่าย ไม่ซับซ้อน มาเป็นตัวช่วย  เพราะการพัฒนา BI Solution เพื่อตอบโจทย์ธุรกิจเพื่อการแข่งขันได้ต้องสามารถได้ Solution ที่ต้องการทันต่อการใช้งาน
 
   Pentaho BI Suite (http://www.pentaho.com/) เป็น Open Source BI Application Software ที่ใช้ Java technology และเป็นที่สนใจอย่างกว้างขวาง หลังจากได้รับรางวัล Bossie Awards 2010: The best open source applications โดย Pentaho ได้มีการพัฒนาชุดซอฟต์แวร์นี้เชิงรุกอย่างต่อเนื่อง  และได้มีการจัดประชุม Pentaho World เป็นประจำทุกปี (https://www.pentahoworld.com/)  
   จุดเด่นอีกประการหนึ่งของ Pentaho Business Analytic Platform คือ รองรับการทำงานกับข้อมูลที่หลากหลาย ทั้งฐานข้อมูล NOSQL การประมวลผล big data ด้วย Hadoop และการวิเคราะห์ข้อมูลด้วย Weka, R, และ Spark  อีกทั้งเป็นระบบ Open Source ที่ติดตั้งง่าย ใช้งานง่าย มีทั้งระบบที่เป็น  Community Edition (Pentaho CE) ซึ่งไม่มีค่าใช้จ่ายด้านซอฟต์แวร์ และระบบ Enterprise Edition (Pentaho EE) ซึ่งเพิ่ม features ต่างๆ มากขึ้นจากระบบ Community Edition โดยมีบริษัท Hitachi Vantara (เจ้าของ Pentaho ตั้งแต่กลางปี 2015) และมีบริษัทที่เป็น Value added distributorในประเทศไทยด้วย ซึ่งนับเป็นโอกาสดีสำหรับการช่วยสนับนุนการพัฒนาระบบสารสนเทศเชิงกลยุทธ์เพื่อมุ่งสู่เศรษฐกิจดิจิทัล (Digital Economy) สำหรับประเทศไทยดังนั้น Pentaho Business Analytic Platform จึงเป็นทางเลือกที่คุ้มค่าที่จะนำมาใช้พัฒนาระบบ Business Intelligence และ Data Science in Business ขององค์กร
 
หลักสูตรที่เปิดอบรม
 
หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science 
(อบรมวันจันทร์-พุธที่ 25 – 27 มิถุนายน 2561)  หลักสูตรนี้เหมาะสำหรับนักพัฒนาระบบสารสนเทศหรือนักวิเคราะห์ข้อมูลทางธุรกิจ
 
วันที่ 1 – วันที่ 2  (ใช้ Pentaho Community Edition) 
ปูพื้นฐานหลักของการพัฒนาระบบ Business Intelligence เป็นการนำเสนอข้อมูลแบบ Descriptive อัตโนมัติ โดยใช้เครื่องมือหลัก 3 ตัว คือ Schema Workbench สำหรับสร้าง OLAP Cube, Data Integration สำหรับทำ ETL (Extract Transform and Load), และ Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard 
 
วันที่ 3  (ใช้ Pentaho Enterprise Edition)
การทำเหมืองข้อมูลด้วย Weka โดยปูพื้นด้วยตัวอย่างข้อมูลของ Weka  จากนั้นใช้ Weka วิเคราะห์ข้อมูลของโจทย์งานวิจัย “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor”  ที่  http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846  ซึ่งยังไม่เป็นระบบอัตโนมัติ  ให้เป็นระบบ BI อัตโนมัติ ด้วย Pentaho โดยใช้ Weka และ deploy model โดยใช้ Pentaho Weka Scoring Plugin Data Science Pack ของ Pentaho Enterprise Edition
 
หลักสูตร 2: Big Data Analytics with Pentaho Hadoop and IOT Use case
(อบรมวันพฤหัสบดี – เสาร์ ที่ 28 – 30 มิถุนายน 2561) หลักสูตรนี้เหมาะสำหรับนักไอทีที่เป็น Data Scientist/Data Engineer และ Computer System Engineer ที่มีพื้นฐานการใช้ Linux command line มาบ้าง 
วันที่ 1  การวิเคราะห์ big data ด้วย Hadoop และ Pentaho-Hadoop ด้วยโจทย์ข้อมูลของ Web log  โดยใช้ Pentaho Data Integration ซึ่งไม่ต้องเขียน JAVA Map-Reduce และการนำเสนอผลการวิเคราะห์ใน Pentaho OLAP Cube, การใช้งาน Hive และ HBase  โดยใช้ Virtual Machine ที่ติดตั้ง CentOS, JAVA, PostgreSQL, Pentaho CE, Hadoop (version 1) เรียบร้อยแล้ว เน้นการใช้งานสำหรับ Data Scientist
 
วันที่ 2: การติดตั้ง Hadoop Cluster (Hadoop version 2) ด้วย Cloudera และทดสอบการใช้งาน 
การ run WordCount ด้วย Java Map-Reduce การวิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem เช่น Hive การใช้งาน Pentaho ร่วมกับ Hadoop, Hive การใช้งาน Hue – Web UI 
 
วันที่ 3: (เนื้อหาใหม่) ปฏิบัติการกรณีศึกษาการวิเคราะห์ข้อมูลจริง (use case) จาก IOT Sensors วัดคุณภาพอากาศ (https://canarin.net/seahazemon/) จากโครงการวิจัยของ intERLab AIT (https://interlab.ait.ac.th/cwmn/index.php) การวิเคราะห์สถิติสำหรับการทำ Exploratory Data Analysis, Time Series, Modelling ด้วยโปรแกรม R, Weka, Pentaho, และเสริมด้วย visualization ด้วย Power BI  
หมายเหตุ สามารถดูรายละเอียดกำหนดการอบรมได้ที่เว็บสมาคม www.tatsc.or.th 
 
วัตถุประสงค์ 
  • เพื่อให้ผู้เข้าอบรมได้รับความรู้และความเข้าใจถึงหลักการของระบบ BI และการวิเคราะห์ข้อมูล
  • เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการในกระบวนการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
  • เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการทำเหมืองข้อมูลสร้างโมเดลพยากรณ์ และการนำโมเดลไปใช้
  • เพื่อให้เข้าอบรมได้เข้าใจหลักการและปฏิบัติการวิเคราะห์ข้อมูลขนาดใหญ่ (big data) พร้อมติดตั้งซอฟต์แวร์ในส่วนต่าง ๆ 
  • เพื่อให้ผู้เข้าอบรมสามารถนำซอฟต์แวร์ Open Source Pentaho BI Suite, Weka, R, Hadoop,   ไปประยุกต์ใช้งานได้
  • เพื่อสร้างเครือข่ายผู้ใช้งาน Pentaho ที่จะร่วมมือ แลกเปลี่ยน และช่วยเหลือซึ่งกันและกัน (ผู้ที่ผ่านการอบรมกับสมาคมแล้ว จะได้รับทราบข้อมูลกิจกรรมที่สมาคมจัด และทีมวิทยากรและผู้ช่วยยินดีให้คำปรึกษาฟรี) 
หลักสูตรนี้เหมาะสำหรับ 
  • ผู้ที่ต้องการเรียนรู้หลักและวิธีการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
  • ผู้ที่ต้องการเรียนรู้หลักการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
  • นักไอทีหรือผู้สอนไอที นักสถิติ และนักธุรกิจที่สนใจไอที
  • ผู้บริหาร เจ้าของหน่วยงาน เจ้าหน้าที่วางแผนเชิงกลยุทธ์ ติดตามนโยบายขององค์กร 
จำนวนรับเข้าอบรมและคุณสมบัติของผู้เข้าอบรม   :  
รับจำนวนจำกัด  หลักสูตรละ 30 คน  
โดยผู้สมัครต้องนำคอมพิวเตอร์โน้ตบุคของตนเองมา ซึ่งต้องมีคุณสมบัติดังนี้

RAM: at least 8 GB
Hard drive space: at least 30 GB free space
Processor: at least Core i5 
OS: Windows7 or higher 64 bits

 
วิธีการอบรม
บรรยายภาพรวมของทฤษฎีและหลักการที่เกี่ยวข้อง  สำหรับภาคปฏิบัติการวิทยากรจะสาธิตตามคู่มือ Step by step  และให้ผู้เข้าอบรมปฏิบัติตาม (เน้นปฏิบัติการเพื่อให้ได้ Solution ที่ใช้งานได้จริง)
โจทย์ที่ใช้ปฏิบัติการจะเป็นตัวอย่างและข้อมูลที่ต่อเนื่องกัน (อบรมแบบ Problem based)  
 
ค่าสมัครในการอบรม
ค่าลงทะเบียน ซึ่งจะมีเอกสารการอบรม  ซอฟต์แวร์ที่ใช้อบรมทั้งหมด ได้แก่  Pentaho BI Suite ทั้ง Enterprise Edition และ Community Edition, Java, PostgreSQL, Weka, R, Cloudera Hadoop และ Utilities อื่น ๆ ที่จำเป็น  พร้อมกระเป๋าเอกสารมอบให้ และรวมอาหารกลางวัน & อาหารว่าง  เช้า-บ่าย ทุกวันอบรม
 
หลักสูตร 1 (3 วัน): คนละ 13,000 บาท 
หลักสูตร 2 (3 วัน): คนละ 13,000 บาท 
หลักสูตร 1 และหลักสูตร 2 (6 วัน) คนละ 22,000 บาท 
หลักสูตร 2 วันที่สามของการอบรม (IOT Use case 1 วัน) คนละ 4,000 บาท 
สำหรับผู้ที่ผ่านการอบรม Pentaho BI กับสมาคมมาแล้ว รับได้ไม่เกิน 10 คน
 
Promotion พิเศษ: สมัครและชำระค่าอบรมภายในวันที่  13 มิถุนายน 2561 
  1. ได้ส่วนลดพิเศษ 10% สำหรับบุคคลทั่วไป
  2. ได้ส่วนลดพิเศษ 20% สำหรับ
    ก. ผู้ที่เคยเข้าอบรมกับสมาคมแล้วในการจัดการอบรมที่ผ่านมาของสมาคมฯ
    ข. เป็นสมาชิกสมาคม (สมัครสมาชิกได้ที่เว็บสมาคม http://www.tatsc.or.th
    ค. เป็นนิสิตนักศึกษาที่กำลังเรียนอยู่ หรืออาจารย์มหาวิทยาลัยที่สอนอยู่
หลักสูตร 1 หรือ 2 (3 วัน): คนละ 13,000 บาท (ส่วนลด 10% เหลือ 11,700, 20% เหลือ 10,400)
หลักสูตร 1 และ 2 (6 วัน): คนละ 22,000 บาท (ส่วนลด 10% เหลือ 19,800, 20% เหลือ 17,600)
หมายเหตุ ราคานี้เป็นราคาสุทธิแล้ว (เนื่องจากสมาคมฯ ไม่ต้องจดทะเบียนภาษีมูลค่าเพิ่ม)
การสมัครเข้าอบรม
โปรดกรอกรายละเอียดของผู้เข้าอบรมที่เว็บสมาคม www.tatsc.or.th และชำระค่าสมัคร
โดยจ่ายเข้า บัญชีธนาคารของสมาคมฯ ดังนี้:
 
 
ธนาคารกรุงเทพ สาขาจามจุรี สแควร์ บัญชีเงินฝากสะสมทรัพย์ เลขที่: 939-0-14153-0 
ชื่อบัญชี: สมาคม ศูนย์วิชาการไทย-ออสเตรเลีย
 
และส่งสำเนา Pay-in slip มาทาง e-mail:   This email address is being protected from spambots. You need JavaScript enabled to view it.
เมื่อทางสมาคมได้รับเอกสารแล้วจะตอบกลับทาง e-mail  
 
อนึ่ง สำหรับผู้เข้าอบรมที่ต้องหักภาษี ณ ที่จ่าย  โปรดออกเอกสารการหักภาษี ณ ที่จ่ายตามรายละเอียดดังนี้ สมาคมศูนย์วิชาการไทย-ออสเตรเลีย  เลขประจำตัวผู้เสียภาษี 0993-000-178998 
ที่อยู่  968  ชั้น  9  อาคารอื้อจือเหลียง ถนนพระราม 4  แขวงสีลม เขตบางรัก กรุงเทพมหานคร 10500
 
หมายเหตุ
  1. สมาคมขอสงวนสิทธิ์ที่จะยกเลิกการอบรมในกรณีที่มีเหตุขัดข้องสุดวิสัย โดยทางสมาคมฯ จะโอนเงินคืนให้ท่านในกรณีที่ท่านได้มีการชำระมาก่อนล่วงหน้า
  2. สมาคมขออนุญาตที่จะออกใบเสร็จรับเงินให้กับผู้อบรมในวันอบรม
  3. หากมีข้อสงสัยประการใด โปรดติดต่อสมาคมที่ e-mail:  This email address is being protected from spambots. You need JavaScript enabled to view it.   หรือที่
    ผศ.ดร.สุณี  รักษาเกียรติศักดิ์  089-211-6224

 

กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, and Hadoop
From Business Intelligence to Data Science
 
หลักสูตร 1: Pentaho BI 
ณ ห้อง Grand Lily ชั้น L โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ 
 
วันจันทร์ที่ 25 มิถุนายน 2561  
08:00 08:45 น. ลงทะเบียน สำหรับหลักสูตร 1
09:00 10:10 น. หัวข้อที่ 1: แนวคิด หลักการ และประโยชน์ ของ “Business Intelligence”
ภาพรวมของระบบ Pentaho Business Intelligence (Pentaho BI)
ติดตั้งระบบ Pentaho Community Edition (Pentaho CE)
(ติดตั้ง Java, ฐานข้อมูล PostgreSQL, Pentaho CE, Design-Tools)
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
10:10 10:30 น. หยุดพักรับประทานอาหารว่าง 
10:30 12:00 น. หัวข้อที่ 2: โจทย์สำหรับทำ BI: 
กรณีศึกษาของระบบงานบุคคล (Human Resource) 
การออกแบบ Data Model 
การนำข้อมูลสำหรับการวิเคราะห์ (ที่ ETL แล้ว) เข้าฐานข้อมูล Postgres 
12:00 13:00 น. หยุดพักรับประทานอาหารกลางวัน
13:00 14:00 น. หัวข้อที่ 3: ทดลองใช้ระบบในฐานะผู้ใช้ (Users)  
Reporting, Analysis (OLAP Cube), Dashboard
14:00 15:00 น. หัวข้อที่ 4: หลักการและปฏิบัติการ: การใช้ Schema Workbench สำหรับสร้าง OLAP Cube
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00 15:20 น. หยุดพักรับประทานอาหารว่าง
15:20 17:00 น. หัวข้อที่ 4: หลักการและปฏิบัติการ: การใช้ Schema Workbench (ต่อ)
วันอังคารที่ 26 มิถุนายน 2561 
09:00 - 10:10 น. หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
10:10 –  10:30 น. หยุดพักรับประทานอาหารว่าง
10:30 12:00 น. หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE)  (ต่อ)
12:00 13:00 น. หยุดพักรับประทานอาหารกลางวัน
13:00 15:00 น. หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration สำหรับจัดเตรียมข้อมูลสำหรับการวิเคราะห์ Extract Transform & Load (ETL)
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
15:00 15:20 น. หยุดพักรับประทานอาหารว่าง
15:20 17:00 น. หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration (ต่อ)
 
วันพุธที่ 27 มิถุนายน 2561   โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
08:30  - 09:00 น. ติดตั้ง PentahoEE 
09:00  – 10:10 น. หัวข้อที่ 7: โจทย์สำหรับทำ BI “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor” ที่ http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846
- ออกแบบ Data model สำหรับการวิเคราะห์
- นำข้อมูล ATutor_wh (ที่ ETL แล้ว) เข้าฐานข้อมูล PostgreSQL 
- ทดสอบ ATutor Pentaho Solutions: Report, Cube, Dashboard as Descriptive
10:10  – 10:30 น. รับประทานอาหารว่าง 
10:30  – 12:00 น. หัวข้อที่ 7: กรณีศึกษา ATutor (ต่อ)
12:00  – 13:00 น. รับประทานอาหารกลางวัน
13:00  – 15:00 น. หัวข้อที่ 8: การทำเหมืองข้อมูลด้วย Weka:
Classification, Prediction, Association, Clustering  
15:00  – 15:20 น. รับประทานอาหารว่าง
15:20  – 17:00 น. หัวข้อที่ 9: ทดลอง run Data Mining: Clustering Predictive Model และ
นำ Model ไปใช้กับข้อมูลชุดใหม่ (Prescriptive)
- แจกประกาศนียบัตร
สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
 

หลักสูตร 2: Big Data Analytics with Pentaho Hadoop and IOT Use case

ณ ห้อง Grand Lily  ชั้น L  โรงแรม Jasmine  สุขุมวิท 23 กรุงเทพฯ
 
วันพฤหัสบดีที่ 28 มิถุนายน 2561   
08:00 – 08:45 น. ลงทะเบียน สำหรับหลักสูตร 2
09:00  – 10:10 น. หัวข้อที่ 1: แนวคิดและหลักการของการวิเคราะห์ big data ด้วย Hadoop และ
Pentaho-Hadoop (Pentaho Data Science Pack)
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
10:10  – 10:30 น. รับประทานอาหารว่าง
10:30  – 12:00 น. หัวข้อที่ 2: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop 
12:00  – 13:00 น. รับประทานอาหารกลางวัน
13:00  – 15:00 น. หัวข้อที่ 3: การใช้งาน Hive, Hbase
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00  – 15:20 น. รับประทานอาหารว่าง
15:20  – 17:00 น. หัวข้อที่ 4: การสร้าง Transformation ของการวิเคราะห์ Web log ด้วย Pentaho-Hadoop 
 
วันศุกร์ที่ 29 มิถุนายน 2561   โดย คุณกิตติรักษ์ ม่วงมิ่งสุข (Cluster Kit)  และคณะ
09:00  – 10:10 น. หัวข้อที่ 5: การติดตั้ง Cloudera Hadoop Cluster และทดสอบการใช้งาน
10:10  – 10:30 น. รับประทานอาหารว่าง
10:30  – 12.00 น. หัวข้อที่ 6: การ run WordCount ด้วย Java Map-Reduce
12:00  – 13.00 น. รับประทานอาหารกลางวัน
13:00  – 15.00 น. หัวข้อที่ 7: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster
15:00  – 15:20 น. รับประทานอาหารว่าง
15:20  – 17:00 น. หัวข้อที่ 8: การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem
 
วันเสาร์ที่  30  มิถุนายน 2561  
ปฏิบัติการกรณีศึกษาการวิเคราะห์ข้อมูลจริง (use case) จาก IOT Sensors วัดคุณภาพอากาศ
 
09:00  – 09:45 น. เตรียมความพร้อม: ติดตั้งโปรแกรม R, Weka, Pentaho CE, Power BI
09:45  – 10:15 น. หัวข้อที่ 9: ความเป็นมาของกรณีศึกษา IOT Sensors วัดคุณภาพอากาศ (https://canarin.net/seah zemon/) จากโครงการวิจัยของ intERLab AIT (https://interlab.ait.ac.th/cwmn/index.php) ร่วมกับ LIP6, UPMC, France
โดย นายปรีชัย เมฆบังวัน และศาสตราจารย์ ดร.กาญจนา  กาญจนสุต 
10:15  – 10:30 น. รับประทานอาหารว่าง
10:30  – 12:00 น. หัวข้อที่ 10: Data Exploration and Data Cleaning (Descriptive Statistics with R and Data Manipulation with Pentaho Data Integration, Data Visualization ด้วย Power BI)
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
12:00  – 13:00 น. รับประทานอาหารกลางวัน
13:00  – 15:00 น. หัวข้อที่ 11: Data Modelling with R and Weka (Regression, Time Series, Linear Model) 
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
15:00  – 15:20 น. รับประทานอาหารว่าง
15:20  – 17:00 น. หัวข้อที่ 11: Data Modelling (ต่อ)
- แจกประกาศนียบัตร
สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ