การอบรมเชิงปฏิบัติการ เรื่อง Data Analytics with Pentaho BI,
Weka, R, Hadoop & Spark From
Business Intelligence to Data Science
5 – 9, 12 - 14 มิถุนายน 2560







     สมาคมศูนย์วิชาการไทย – ออสเตรเลีย ซึ่งได้ก่อตั้งขึ้นในประเทศไทยมากวา่า 30 ปี เป็นองค์กรที่ไม่แสวงหาผลกำไร และมีความร่วมมือกับหน่วยงานต่าง ๆ ในการจัดกิจกรรมการสัมมนา/อบรมเชิงปฏิบัติการทางวิชาการต่างๆ  ได้จัดอบรมเชิงปฏิบัติการเกี่ยวกับ Business Intelligence โดยใช้ Open Source Pentaho Business Analytic Platform  ขึ้นปีที่ 7 แล้ว  โดยคณะวิทยากรผู้เชี่ยวชาญ นำโดย ผศ. ดร. สุณี รักษาเกียรติศักดิ์ ศิษย์เก่าออสเตรเลีย  โดยได้จัดโครงการอบรมครั้งแรกในรุ่นที่ 1 ในวันที่ 18-20 กุมภาพันธ์ 2554 (2011) และได้รับการตอบรับอย่างดีจากหน่วยงานต่าง ๆ ทั้งภาครัฐ เอกชน และสถาบันการศึกษา สมาคมฯ ได้จัดต่อเนื่องมาจนปัจจุบัน โดยได้มีการปรับเนื้อหาหลักสูตรตามความก้าวหน้าของเทคโนโลยี และเพิ่มเนื้อหาเข้มข้นมากขึ้นจากการศึกษาเพิ่มเติมอย่างต่อเนื่อง โดยจัดปีละ 2 ครั้งเท่านั้น ครั้งสุดท้ายที่ผ่านมาจัดเมื่อ 19 – 24 ธันวาคม 2559 มีผู้สมัครเต็มจำนวนก่อนการอบรม 1 สัปดาห์
     ในการอบรมครั้งนี้สมาคมฯ ร่วมกับบริษัท ClusterKit (www.clusterkit.co.th) จัดการอบรม 2 หลักสูตร คือ
หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science
เป็นการปูพื้นฐานของการวิเคราะห์ข้อมูลหลักด้วย Descriptive Modeling แต่เป็นการนำเสนอผลลัพธ์ของการวิเคราะห์แบบอัตโนมัติในรูปแบบของ Report, Analysis OLAP Cube, และ Dashboard  ซึ่งเป็นจุดเริ่มต้นของการพัฒนาระบบ Business Intelligence และขยายจาก Descriptive เป็น Predictive Modeling ด้วยการทำ Data Mining ด้วย Weka และการ deploy Model ไปใช้กับข้อมูลชุดใหม่ (Prescriptive) แบบอัตโนมัติโดยไม่ต้องเขียนโปรแกรม โดยใช้ Pentaho Data Science Pack API นอกจากนั้นยังได้เพิ่มโจทย์การวิเคราะห์ข้อมูลขนาดใหญ่ (big data) ด้วย Pentaho-Hadoop (version 1) เพื่อให้นักวิเคราะห์ข้อมูลเข้าใจหลักการประมวลผล big data โดยนักวิเคราะห์ไม่ต้องเขียนโปรแกรมภาษา JAVA สำหรับการวิเคราะห์ด้วย Map-Reduce แต่ Pentaho จะมี Data Science Pack ซึ่งเป็น JAVA API อำนวยความสะดวกให้
หลักสูตร 2: Big Data Processing with Cloudera Hadoop Cluster and Spark
เป็นการติดตั้งและประมวลผล big data ด้วย Cloudera Hadoop Cluster, Hive, เครื่องมือตัวอื่น ๆ ของ Hadoop Ecosystem, การใช้งาน Pentaho-Hadoop, การติดตั้งและประมวลผลด้วย Spark  และตัวอย่างการใช้งาน Spark Machine Learning
     การอบรมจะจัดขึ้นในวันจันทร์ – ศุกร์ ที่ 5 – 9 มิถุนายน 2560 สำหรับหลักสูตร 1  และวันจันทร์ – พุธ ที่ 12 - 14 มิถุนายน 2560  สำหรับหลักสูตร 2 ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine   สุขุมวิท 23 กรุงเทพฯ (BTS สถานีอโศก หรือ MRT สถานีสุขุมวิท)  โทร.  02-204-5885 ผู้สนใจสามารถดูรายละเอียดและสมัครได้ที่เว็บสมาคมฯ www.tatsc.or.th 


หลักการและเหตุผล
     ในการดำเนินธุรกิจขององค์กรจำเป็นต้องอาศัยระบบไอทีอย่างหลีกเลี่ยงไม่ได้ ผลจากการใช้งาน/การประมวลผลรายการ (operational transaction processing) ของระบบไอทีทำให้เกิดระบบฐานข้อมูลขนาดใหญ่ขององค์กร ซึ่งนับเป็นสินทรัพย์อันมีค่าขององค์กร แต่เป็นที่น่าเสียดายที่ข้อมูลมากมายที่อยู่ในฐานข้อมูลไม่สามารถนำมาใช้ประโยชน์ในเชิงวิเคราะห์ เปรียบเทียบ หรือสร้างความรู้เกี่ยวกับการดำเนินธุรกิจขององค์กร เพื่อสนับสนุนการวางแผนเชิงกลยุทธ์และการตัดสินใจของผู้บริหารได้อย่างมีประสิทธิภาพ ถึงแม้องค์กรจะได้ทุ่มงบประมาณมากมายในการได้มาซึ่งระบบไอทีเหล่านั้นก็ตาม และการได้มาซึ่งระบบไอทีแต่ละระบบก็อาจจะได้มาต่างเวลากันด้วยเครื่องมือหรือฐานข้อมูลในการจัดเก็บที่ต่างกัน ซึ่งก็เป็นธรรมชาติของการดำเนินการทางธุรกิจอันหลีกเลี่ยงไม่ได้ที่จะเกิดระบบงานใหม่ ๆ และข้อมูลใหม่ ๆ เกิดขึ้นอยู่ตลอดเวลา
     นอกจากนั้นแล้วข้อมูลเป็นจำนวนมากที่อยู่ในองค์กรก็ไม่ได้จัดเก็บในระบบฐานข้อมูลอย่างเดียว อาจจะจัดเก็บในแผ่นตารางทำการ (Spread Sheet เช่น Excel) หรือแม้แต่ข้อมูลที่เกิดขึ้นเป็นจำนวนมากจากอุปกรณ์ sensor ต่าง ๆ ในองค์กร ข้อมูลใน Weblog ของระบบคอมพิวเตอร์ขององค์กร ข้อมูลใน Social media ต่าง ๆ ที่เกี่ยวข้องกับองค์กร ซึ่งเรารู้จักกันในหัวข้อ “Big data” ซึ่งมีคุณสมบัติ 3V คือมีขนาดใหญ่ (Volume) เกิดขึ้นอย่างรวดเร็ว (Velocity) และมีรูปแบบที่หลากหลาย (Variety)  โดยข้อมูลเหล่านี้จะถูกจัดเก็บและประมวลผลด้วยรูปแบบใหม่ ซึ่งเป็นการประมวลผลแบบกระจาย (distributed)  ใช้ฐานข้อมูลแบบ NOSQL แทนฐานข้อมูลแบบสัมพันธ์ (Relational Database) เราจะจัดการและวิเคราะห์ข้อมูลเหล่านี้อย่างไร
     เนื่องด้วยสารสนเทศหรือความรู้เกี่ยวกับการดำเนินธุรกิจที่จำเป็นต้องใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจต้องมาจากข้อมูลหลายแหล่ง และต้องได้มาในเวลาอันรวดเร็ว ในรูปแบบที่ผู้บริหารเข้าใจได้ง่าย และสามารถดูสารสนเทศที่ต้องการได้หลายมุมมองตามความต้องการ และดูข้อมูลย้อนหลังได้สำหรับการวิเคราะห์ เปรียบเทียบ ซึ่งสารสนเทศที่เกิดจากระบบไอทีแต่ละระบบไม่สามารถตอบโจทย์ได้  ดังนั้นองค์กรจึงมีความจำเป็นต้องพัฒนาระบบคลังข้อมูล (data warehouse)  และพัฒนาระบบสารสนเทศอัจฉริยะทางธุรกิจ (Business Intelligence หรือ BI) เพื่อให้ได้สารสนเทศแบบอัตโนมัติที่ผู้บริหารระดับสูงใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจ

 

   การพัฒนาระบบ BI ให้ประสบความสำเร็จจำเป็นต้องมีทีมพัฒนาจาก 3 กลุ่มคือ 
1)  ผู้ดูแลฐานข้อมูล หรือ DBA
2)  นักวิเคราะห์ข้อมูล หรือ Data Analyst และ 
3)  นักวิเคราะห์ธุรกิจ หรือ Business Analyst
และที่จำเป็นอย่างยิ่งคือต้องมี Application Software ที่ใช้งานง่าย ไม่ซับซ้อน มาเป็นตัวช่วยเพราะการพัฒนา BI Solution เพื่อตอบโจทย์ธุรกิจเพื่อการแข่งขันได้ต้องสามารถได้ Solution ที่ต้องการทันต่อการใช้งาน

     Pentaho BI Suite (http://www.pentaho.com/) เป็น Open Source BI Application Software ที่ใช้ Java technology และเป็นที่สนใจอย่างกว้างขวาง หลังจากได้รับรางวัล Bossie Awards 2010: The best open source applications โดย Pentaho ได้มีการพัฒนาชุดซอฟต์แวร์นี้เชิงรุกอย่างต่อเนื่อง  และได้มีการจัดประชุม Pentaho World เป็นประจำทุกปี (https://www.pentahoworld.com/) นอกจากนั้นแล้วในการวิเคราะห์ข้อมูลทางธุรกิจยังมีซอฟต์แวร์ Open Source ที่เป็นที่นิยมในการวิเคราะห์ข้อมูลทางสถิติ (Statistical data analysis) และการทำเหมืองข้อมูล (Data mining) เช่น โปรแกรม R และโปรแกรม Weka  เป็นต้น  
     จุดเด่นอีกประการหนึ่งของ Pentaho Business Analytic Platform คือ รองรับการทำงานกับข้อมูลที่หลากหลาย ทั้งฐานข้อมูล NOSQL การประมวลผล big data ด้วย Hadoop และการวิเคราะห์ข้อมูลด้วย Weka, R, และ Spark  อีกทั้งเป็นระบบ Open Source ที่ติดตั้งง่าย ใช้งานง่าย มีทั้งระบบที่เป็น  Community Edition (Pentaho CE) ซึ่งไม่มีค่าใช้จ่ายด้านซอฟต์แวร์ และระบบ Enterprise Edition (Pentaho EE) ซึ่งเพิ่ม features ต่างๆ มากขึ้นจากระบบ Community Edition โดยมีบริษัท Hitachi Data Systems (เจ้าของ Pentaho ตั้งแต่กลางปี 2015) และมีบริษัทที่เป็น Value added distributorในประเทศไทยด้วย ซึ่งนับเป็นโอกาสดีสำหรับการช่วยสนับนุนการพัฒนาระบบสารสนเทศเชิงกลยุทธ์เพื่อมุ่งสู่เศรษฐกิจดิจิทัล (Digital Economy) สำหรับประเทศไทย  ดังนั้น Pentaho Business Analytic Platform จึงเป็นทางเลือกที่คุ้มค่าที่จะนำมาใช้พัฒนาระบบ Business Intelligence และ Data Science in Business ขององค์กร


หลักสูตรที่เปิดอบรม
หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science (อบรมวันจันทร์-ศุกร์ที่ 5 – 9  มิถุนายน 2560)  หลักสูตรนี้เหมาะสำหรับนักพัฒนาระบบสารสนเทศหรือนักวิเคราะห์ข้อมูลทางธุรกิจ

วันที่ 1 – วันที่ 3 เป็นการปูพื้นฐานหลักของการพัฒนาระบบ Business Intelligence เป็นการนำเสนอข้อมูลแบบ Descriptive อัตโนมัติ โดยใช้เครื่องมือหลัก 4 ตัวคือ Report Designer สำหรับสร้างรายงาน, Schema Workbench สำหรับสร้าง OLAP Cube, Data Integration สำหรับทำ ETL (Extract Transform and Load), Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard  และเครื่องมือเสริมอีก 2 ตัว คือ Meta Data Editor สำหรับสร้าง Business View ของข้อมูลให้กับผู้ใช้แต่ละกลุ่ม และ Aggregation Designer สำหรับการ Aggregate ข้อมูลจาก OLAP Cube เพื่อเพิ่มประสิทธิภาพในการแสดงผลข้อมูล โดยใช้ Pentaho Community Edition

วันที่ 4  เป็นการทำเหมืองข้อมูลด้วย Weka โดยปูพื้นด้วยตัวอย่างข้อมูลของ Weka  จากนั้นใช้ Weka วิเคราะห์ข้อมูลของโจทย์งานวิจัย “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor”  ที่  http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846  ซึ่งยังไม่เป็นระบบอัตโนมัติ  ให้เป็นระบบ BI อัตโนมัติ ด้วย Pentaho โดยใช้ Weka และ deploy model โดยใช้ Pentaho Weka Scoring Plugin Data Science Pack ของ Pentaho Enterprise Edition

วันที่ 5  เป็นการวิเคราะห์ big data ด้วย Hadoop และ Pentaho-Hadoop ด้วยโจทย์ข้อมูลของ Web log  ใช้ Pentaho Data Integration โดยไม่ต้องเขียน JAVA Map-Reduce และการนำเสนอผลการวิเคราะห์ใน Pentaho OLAP Cube, การใช้งาน Hive และ HBase  โดยใช้ Virtual Machine ที่ติดตั้ง CentOS, JAVA, PostgreSQL, Pentaho CE, Hadoop (version 1) เรียบร้อยแล้ว เน้นการใช้งานสำหรับ Data Scientist

หลักสูตร 2: Big Data Processing ด้วย Cloudera Hadoop Cluster and Spark  (อบรมวันจันทร์-พุธที่ 12-14 มิถุนายน 2560) หลักสูตรนี้เหมาะสำหรับนักไอทีที่เป็น Computer System Engineer มีพื้นฐานการใช้ Linux command line มาบ้าง

วันที่ 1 – วันที่ 2: การติดตั้ง Hadoop Cluster (Hadoop version 2) ด้วย Cloudera และทดสอบการใช้งาน การ run WordCount ด้วย Java Map-Reduce, Pig การวิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem รู้จัก Hive การติดตั้ง Hive และทดสอบการใช้งาน การใช้งาน Pentaho ร่วมกับ Hive การใช้งาน Hue – Web UI การใช้งาน Flume เพื่อเก็บ Log File แบบต่อเนื่อง

วันที่ 3: รู้จัก Spark การติดตั้ง Spark และทดสอบการใช้งาน การใช้งาน Spark ผ่านภาษา python (pyspark) ตัวอย่างการใช้งาน Spark Machine Learning
หมายเหตุ สามารถดูรายละเอียดกำหนดการอบรมได้ที่เว็บสมาคม www.tatsc.or.th


วัตถุประสงค์ 

  • เพื่อให้ผู้เข้าอบรมได้รับความรู้และความเข้าใจถึงหลักการของระบบ BI และการวิเคราะห์ข้อมูล
  • เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการในกระบวนการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
  • เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการวิเคราะห์ข้อมูลทางสถิติ การทำเหมืองข้อมูล และการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
  • เพื่อให้ผู้เข้าอบรมสามารถนำซอฟต์แวร์ Open Source Pentaho BI Suite, Weka, R, Hadoop ไปประยุกต์ใช้งานได้
  • เพื่อสร้างเครือข่ายผู้ใช้งาน Pentaho, Hadoop & Spark ที่จะร่วมมือ แลกเปลี่ยน และช่วยเหลือซึ่งกันและกัน


หลักสูตรนี้เหมาะสำหรับ

  • ผู้ที่ต้องการเรียนรู้หลักและวิธีการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
  • ผู้ที่ต้องการเรียนรู้การวิเคราะห์ข้อมูลด้วยวิธีการทางสถิติ วิธีการทำเหมืองข้อมูลและการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
  • นักไอทีหรือผู้สอนไอที นักสถิติ และนักธุรกิจที่สนใจไอที
  • ผู้บริหาร เจ้าของหน่วยงาน เจ้าหน้าที่วางแผนเชิงกลยุทธ์ ติดตามนโยบายขององค์กร

จำนวนรับเข้าอบรมและคุณสมบัติของผู้เข้าอบรม 
รับจำนวนจำกัด  หลักสูตรละ 30 คน
โดยผู้สมัครต้องนำคอมพิวเตอร์โน้ตบุคของตนเองมา ซึ่งต้องมีคุณสมบัติดังนี้

 

RAM: at least 8 GB
Hard drive space: at least 30 GB
Processor: at least Core i5 
OS: Windows7 or higher 64 bits
สำหรับหลักสูตร 2 ถ้ามีได้ spec. ที่สูงกว่า เช่น RAM 12 – 16 GB ก็จะดี

 

วิธีการอบรม
บรรยายภาพรวมของทฤษฎีและหลักการที่เกี่ยวข้อง  สำหรับภาคปฏิบัติการวิทยากรจะสาธิตตามคู่มือ Step by step  และให้ผู้เข้าอบรมปฏิบัติตาม (เน้นปฏิบัติการเพื่อให้ได้ Solution ที่ใช้งานได้จริง)
โจทย์ที่ใช้ปฏิบัติการจะเป็นตัวอย่างและข้อมูลที่ต่อเนื่องกัน (อบรมแบบ Problem based)  

ค่าสมัครในการอบรม
ค่าลงทะเบียน ซึ่งจะมีเอกสารการอบรม  ซอฟต์แวร์ที่ใช้อบรมทั้งหมด ได้แก่  Pentaho BI Suite ทั้ง Enterprise Edition และ Community Edition, Java, PostgreSQL, Weka, R, Cloudera Hadoop & Spark และ Utilities อื่น ๆ ที่จำเป็น  พร้อมกระเป๋าเอกสารมอบให้ และรวมอาหารกลางวัน & อาหารว่าง  เช้า-บ่าย ทุกวันอบรม

หลักสูตร 1 (5 วัน): คนละ 20,000 บาท 
หลักสูตร 2 (3 วัน): คนละ 13,000 บาท 


Promotion พิเศษ: สมัครและชำระค่าอบรมภายในวันที่   25 พฤษภาคม 2560  
1.ได้ส่วนลดพิเศษ 10% สำหรับบุคคลทั่วไป
2.ได้ส่วนลดพิเศษ 20% สำหรับ
    ก. ผู้ที่เคยเข้าอบรมกับสมาคมแล้วในการจัดการอบรมที่ผ่านมาของสมาคมฯ
    ข. เป็นศิษย์เก่าออสเตรเลีย (ลงทะเบียนสมาชิกได้ที่เว็บสมาคม http://www.tatsc.or.th ) 
    ค. เป็นนิสิตนักศึกษาที่กำลังเรียนอยู่ หรืออาจารย์มหาวิทยาลัยที่สอนอยู่

หลักสูตร 1 (5 วัน): คนละ 20,000 บาท (ส่วนลด 10% เหลือ 18,000, 20% เหลือ 16,000)
หลักสูตร 2 (3 วัน): คนละ 13,000 บาท (ส่วนลด 10% เหลือ 11,700, 20% เหลือ 10,400)


หมายเหตุ ราคานี้เป็นราคาสุทธิแล้ว (เนื่องจากสมาคมฯ ไม่ต้องจดทะเบียนภาษีมูลค่าเพิ่ม) 


การสมัครเข้าอบรม
โปรดกรอกรายละเอียดของผู้เข้าอบรมที่เว็บสมาคม www.tatsc.or.th และชำระค่าสมัคร
โดยจ่ายเข้า บัญชีธนาคารของสมาคมฯ ดังนี้

 

ธนาคารกรุงเทพ สาขาจามจุรี สแควร์   บัญชีเงินฝากสะสมทรัพย์ เลขที่: 939-0-14153-0 
ชื่อบัญชี: สมาคม ศูนย์วิชาการไทย-ออสเตรเลีย

และส่งสำเนา Pay-in slip มาทาง email : This email address is being protected from spambots. You need JavaScript enabled to view it.
เมื่อทางสมาคมได้รับเอกสารแล้วจะตอบกลับทาง email

 

อนึ่ง สำหรับผู้เข้าอบรมที่ต้องหักภาษี ณ ที่จ่าย  
โปรดออกเอกสารการหักภาษี ณ ที่จ่าย ตามรายละเอียดดังนี้ สมาคมศูนย์วิชาการไทย-ออสเตรเลีย  
เลขประจำตัวผู้เสียภาษี 0993-000-178998 
ที่อยู่  968  ชั้น  9  อาคารอื้อจือเหลียง ถนนพระราม 4  แขวงสีลม เขตบางรัก กรุงเทพมหานคร 10500

หมายเหตุ :
1) สมาคมขอสงวนสิทธิ์ที่จะยกเลิกการอบรมในกรณีที่มีเหตุขัดข้องสุดวิสัย โดยทางสมาคมฯ จะโอนเงินคืนให้ท่านในกรณีที่ท่านได้มีการชำระมาก่อนล่วงหน้า
2) สมาคมขออนุญาตที่จะออกใบเสร็จรับเงินให้กับผู้อบรมในวันอบรม
3) หากมีข้อสงสัยประการใด โปรดติดต่อสมาคมที่ e-mail: This email address is being protected from spambots. You need JavaScript enabled to view it.  
หรือที่ ผศ.ดร.สุณี  รักษาเกียรติศักดิ์  089-211-6224


 

กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, R, Hadoop & Spark:

From Business Intelligence to Data Science

หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ 

วันที่หนึ่ง: วันจันทร์ที่  5  มิถุนายน  2560  

08:00     –     08:45 น.    ลงทะเบียน สำหรับหลักสูตร 1
09:00     –     10:10 น.    หัวข้อที่ 1: แนวคิด หลักการ และประโยชน์ ของ “Business Intelligence”
                                      ภาพรวมของระบบ Pentaho Business Intelligence (Pentaho BI)

                                      ติดตั้งระบบ Pentaho Community Edition (Pentaho CE)
                                      (ติดตั้ง Java, ฐานข้อมูล PostgreSQL, Pentaho CE, Design-Tools)
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
10:10     –     10:30 น.    หยุดพักรับประทานอาหารว่าง 
10:30     –     12:00 น.    หัวข้อที่ 2: โจทย์สำหรับทำ BI: 

                                      กรณีศึกษาของระบบงานบุคคล (Human Resource) 
                                      การออกแบบ Data Model 
                                      การนำข้อมูลสำหรับการวิเคราะห์ (ที่ ETL แล้ว) เข้าฐานข้อมูล Postgres 
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
12:00     –     13:00 น.    หยุดพักรับประทานอาหารกลางวัน
13:00     –     14:00 น.    หัวข้อที่ 3: ทดลองใช้ระบบในฐานะผู้ใช้ (Users)  

                                      Reporting, Analysis (OLAP Cube), Dashboard
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
14:00     –     15:00 น.     หัวข้อที่ 4: หลักการและปฏิบัติการ: การสร้างรายงาน (Reporting) 

                                      โดยใช้ Report Designer 
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00     –     15:20 น.    หยุดพักรับประทานอาหารว่าง
15:20     –     17:00 น.    หัวข้อที่ 4: หลักการและปฏิบัติการ: การสร้างรายงาน (ต่อ)

วันที่สอง: วันอังคารที่  6  มิถุนายน  2560  

09:00    
 –     10:10 น.    หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Schema Workbench
                                      สำหรับสร้าง OLAP Cube
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
10:10     –     10:30 น.    หยุดพักรับประทานอาหารว่าง
10:30     –     12:00 น.    หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Schema Workbench (ต่อ)
12:00     –     13:00 น.    หยุดพักรับประทานอาหารกลางวัน
13:00     –     15:00 น.    หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration

                                      สำหรับจัดเตรียมข้อมูลสำหรับการวิเคราะห์ Extract Transform & Load (ETL) 
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
15:00     –     15:20 น.    หยุดพักรับประทานอาหารว่าง
15:20     –     17:00 น.    หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration (ต่อ)

วันที่สาม: วันพุธที่  7  มิถุนายน  2560  

09:00     –     10:10 น.    หัวข้อที่ 7: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE)

                                      สำหรับสร้าง Dashboard
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์  วิยานนท์ และคณะ
10:10     –     10:30 น.    หยุดพักรับประทานอาหารว่าง
10:30     –     12:00 น.    หัวข้อที่ 7: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE)  (ต่อ)
12:00     –     13:00 น.    หยุดพักรับประทานอาหารกลางวัน
13:00     –     15:00 น.    หัวข้อที่ 8: ปฏิบัติการ Aggregate ข้อมูล ด้วย Aggregation Designer

                                      และ Schema Workbench
                                      วิเคราะห์ OLAP Cube โดยใช้ Analysis Report ของ Pentaho EE
                                      (จะมีการติดตั้ง Pentaho EE)
                                      โดย ผศ.ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
15:00     –    15:20 น.    หยุดพักรับประทานอาหารว่าง
15:20     –    17:00 น.    หัวข้อที่ 9: ปฏิบัติการสร้าง Business View ด้วย Metadata Editor

                                      และทดสอบการใช้งานกับ Interactive Report ของ Pentaho EE
                                      โดย ผศ.ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ

วันที่สี่: วันพฤหัสบดีที่  8  มิถุนายน  2560

09:00     –    10:10 น.    หัวข้อที่ 10: โจทย์สำหรับทำ BI “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์:
                                       กรณีศึกษาของระบบ ATutor”
                                      ที่ http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846
                                      - ออกแบบ Data model สำหรับการวิเคราะห์
                                      - นำข้อมูล ATutor_wh (ที่ ETL แล้ว) เข้าฐานข้อมูล PostgreSQL 
                                      - ทดสอบ ATutor Pentaho Solutions: Report, Cube, Dashboard
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
10:10
     –     10:30 น.    รับประทานอาหารว่าง 
10:30     –     12:00 น.     หัวข้อที่ 11: ภาพรวมของ แนวคิดและหลักการของการวิเคราะห์ข้อมูล:

                                      วิธีการทางสถิติ (statistical methods), วิธีการทำเหมืองข้อมูล (data mining),
                                      Business Intelligence and Data Science
                                      - ปฏิบัติการการวิเคราะห์ Descriptive Statistics (OLAP Cube)
                                      การหาความสัมพันธ์ของ attributes
                                      และการสร้าง Regression model ด้วยโปรแกรม R
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
12:00
     –     13:00 น.    รับประทานอาหารกลางวัน
13:00     –     15:00 น.    หัวข้อที่ 12: การทำเหมืองข้อมูลด้วย Weka:

                                      Classification, Prediction, Association, Clustering 
                                      โดยใช้ Explorer และ Experimenter Interface 
                                      โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ 
15:00     –     15:20 น.     รับประทานอาหารว่าง
15:20     –     17:00 น.    หัวข้อที่ 13: การวิเคราะห์ข้อมูลของโจทย์สำหรับทำ BI “การทำเหมืองข้อมูล ATutor”
                                            โจทย์ประเภท Clustering โดยใช้ Knowledge Flow Interface และการนำโมเดล Weka
                                     เข้า Pentaho Data Integration (ETL)
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ

วันที่ห้า: วันศุกร์ที่  9  มิถุนายน  2560  

09:00
     –     10:10 น.    หัวข้อที่ 14: แนวคิดและหลักการของการวิเคราะห์ big data ด้วย Hadoop (version 1)                                             และ Pentaho-Hadoop (Pentaho Data Science Pack)
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
10:10
     –     10:30 น.    รับประทานอาหารว่าง
10:30
     –     12:00 น.    หัวข้อที่ 15: การวิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop 
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
12:00
     –     13:00 น.    รับประทานอาหารกลางวัน
13:00
     –     15:00 น.    หัวข้อที่ 16: การใช้งาน Hive, Hbase
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์  วิยานนท์ และคณะ
15:00
     –     15:20 น.    รับประทานอาหารว่าง
15:20
     –     16:30 น.    หัวข้อที่ 17: การสร้าง Transformation ของการวิเคราะห์ Web log
                                     ด้วย Pentaho-Hadoop 
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์  วิยานนท์ และคณะ
16:30
     –     17:00 น.    แจกประกาศนียบัตร
                                     สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
                                     คณะวิทยากรและผู้ช่วย:  ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์,
                                     ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์  วิยานนท์, คุณพงษ์พัฒน์ วิวัฒนเศรษฐการ,
                                     ว่าที่ ร.ต.สะอาด สืบสมาน

หลักสูตร 2: Big Data Processing with Cloudera Hadoop Cluster and Spark

วันที่หนึ่ง: วันจันทร์ที่  12  มิถุนายน  2560

09:00
          10:10 น.     หัวข้อที่ 1: การติดตั้ง Hadoop Cluster ด้วย Cloudera และทดสอบการใช้งาน
10:10
          10:30 น.    รับประทานอาหารว่าง
10:30
          12:00 น.    หัวข้อที่ 1 (ต่อ) และ
                                     หัวข้อที่ 2: การ run WordCount ด้วย Java Map-Reduce, Pig
12:00
          13:00 น.    รับประทานอาหารกลางวัน
13:00
          15:00 น.    หัวข้อที่ 3: การวิเคราะห์ข้อมูลตัวอย่าง Web log
                                     ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster
15:00
          15:20 น.    รับประทานอาหารว่าง
15:20
          17:00 น.    หัวข้อที่ 4: การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem 

วันที่สอง: วันอังคารที่  13  มิถุนายน  2560

09:00
          10:10 น.     หัวข้อที่ 5: รู้จัก Hive การติดตั้ง Hive และทดสอบการใช้งาน
10:10
          10:30 น.     รับประทานอาหารว่าง
10:30
          12.00 น.     หัวข้อที่ 6: การใช้งาน Pentaho ร่วมกับ Hive
12:00
          13.00 น.     รับประทานอาหารกลางวัน
13:00
          15.00 น.     หัวข้อที่ 7: การใช้งาน Hue – Web UI
15:00
          15:20 น.     รับประทานอาหารว่าง
15:20
          17.00 น.     หัวข้อที่ 8: การใช้งาน Flume เพื่อเก็บ Log File แบบต่อเนื่อง

วันที่สาม: วันพุธที่  14  มิถุนายน  2560

09:00
          10.10 น.    หัวข้อที่ 9: รู้จัก Spark และการติดตั้ง Spark และทดสอบการใช้งาน
10:10
          10:30 น.    รับประทานอาหารว่าง
10:30
          12.00 น.    หัวข้อที่ 9 (ต่อ)
12:00
          13.00 น.    รับประทานอาหารกลางวัน
13:00
          15.00 น.    หัวข้อที่ 10: การใช้งาน Spark ผ่านภาษา python (pyspark)
15:00
          15:20 น.    รับประทานอาหารว่าง
15:20
          17.00 น.    หัวข้อที่ 11: ตัวอย่างการใช้งาน Spark ML
                                     คณะวิทยากรและผู้ช่วย: คุณกิตติรักษ์ ม่วงมิ่งสุข, คุณดนย์ จั่นเจริญ, คุณอภิรัฐ พรมญาน

แผนที่โรงแรม Jasmine (อาคารจัสมิน)