การอบรมเชิงปฏิบัติการ เรื่อง Data Analytics with Pentaho BI,
Weka, Hadoop & Spark From
Business Intelligence to Data Science
30 พฤศจิกายน - 2 ธันวาคม, 4 - 6 ธันวาคม 2560







     สมาคมศูนย์วิชาการไทย – ออสเตรเลีย ซึ่งได้ก่อตั้งขึ้นในประเทศไทยมากวา่า 30 ปี เป็นองค์กรที่ไม่แสวงหาผลกำไร และมีความร่วมมือกับหน่วยงานต่าง ๆ ในการจัดกิจกรรมการสัมมนา/อบรมเชิงปฏิบัติการทางวิชาการต่างๆ  ได้จัดอบรมเชิงปฏิบัติการเกี่ยวกับ Business Intelligence โดยใช้ Open Source Pentaho Business Analytic Platform  ขึ้นปีที่ 7 แล้ว  โดยคณะวิทยากรผู้เชี่ยวชาญ นำโดย ผศ. ดร. สุณี รักษาเกียรติศักดิ์ ศิษย์เก่าออสเตรเลีย  โดยได้จัดโครงการอบรมครั้งแรกในรุ่นที่ 1 ในวันที่ 18-20 กุมภาพันธ์ 2554 (2011) และได้รับการตอบรับอย่างดีจากหน่วยงานต่าง ๆ ทั้งภาครัฐ เอกชน และสถาบันการศึกษา สมาคมฯ ได้จัดต่อเนื่องมาจนปัจจุบัน โดยได้มีการปรับเนื้อหาหลักสูตรตามความก้าวหน้าของเทคโนโลยี และเพิ่มเนื้อหาเข้มข้นมากขึ้นจากการศึกษาเพิ่มเติมอย่างต่อเนื่อง โดยจัดปีละ 2 ครั้งเท่านั้น ในการจัดทุกครั้งได้รับการตอบรับเป็นอย่างดี มาก
     ในการอบรมครั้งนี้ จัด 2 หลักสูตร เช่นเดิม คือ แต่จะลดจำนวนวันอบรมลง เน้นเนื้อหาหลักที่จำเป็นและเนื้อหาใหม่ ๆ (เนื่องด้วยเนื้อหาส่วนใหญ่ได้มีการจัดทำวีดีทัศน์เผยแพร่แล้ว โดยไม่มีค่าใช้จ่ายที่ http://ddeclass.com/vcatalog/126) ได้แก่
หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science
เป็นการปูพื้นฐานการวิเคราะห์ข้อมูลหลักด้วย Descriptive Modeling แต่เป็นการนำเสนอผลลัพธ์ของการวิเคราะห์แบบอัตโนมัติในรูปแบบของ Report, Analysis OLAP Cube, และ Dashboard ซึ่งเป็นจุดเริ่มต้นของการพัฒนาระบบ Business Intelligence และขยายจาก Descriptive เป็น Predictive Modeling ด้วยการทำ Data Mining โดยใช้ Weka และการ deploy Model ไปใช้กับข้อมูลชุดใหม่ (Prescriptive) แบบอัตโนมัติโดยไม่ต้องเขียนโปรแกรม โดยใช้ Pentaho Data Science Pack API
หลักสูตร 2: Big Data Workshop with Pentaho Hadoop & Spark
เป็นการปูพื้นฐานการวิเคราะห์ข้อมูลขนาดใหญ่ (big data) ด้วย Pentaho-Hadoop (Hadoop version 1) เพื่อให้นักวิเคราะห์ข้อมูลเข้าใจหลักการประมวลผล big data โดยนักวิเคราะห์ไม่ต้องเขียนโปรแกรมภาษา JAVA สำหรับการวิเคราะห์ด้วย Map-Reduce แต่ Pentaho จะมี Data Science Pack ซึ่งเป็น JAVA API อำนวยความสะดวกให้ การติดตั้งและประมวลผล big data ด้วย Cloudera Hadoop Cluster, Hive, เครื่องมือตัวอื่น ๆ ของ Hadoop Ecosystem, การใช้งาน Pentaho-Hadoop, การติดตั้งและประมวลผลด้วย Hadoop & Spark การนำ Big data ไปใช้ในองค์องค์ และตัวอย่างการนำไปใช้ในงานจริง
     การอบรมจะจัดขึ้นในวันพฤหัส-เสาร์ ที่ 30 พฤศจิกายน - 2 ธันวาคม 2560 สำหรับหลักสูตร 1 และ วันจันทร์-พุธ ที่ 4-6 ธันวาคม 2560 สำหรับหลักสูตร 2 ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ (BTS สถานีอโศก หรือ MRT สถานีสุขุมวิท) โทร. 02-204-5885 ผู้สนใจสามารถดูรายละเอียดและสมัครได้ที่เว็บสมาคมฯ www.tatsc.or.th 


หลักการและเหตุผล
     ในการดำเนินธุรกิจขององค์กรจำเป็นต้องอาศัยระบบไอทีอย่างหลีกเลี่ยงไม่ได้ ผลจากการใช้งาน/การประมวลผลรายการ (operational transaction processing) ของระบบไอทีทำให้เกิดระบบฐานข้อมูลขนาดใหญ่ขององค์กร ซึ่งนับเป็นสินทรัพย์อันมีค่าขององค์กร แต่เป็นที่น่าเสียดายที่ข้อมูลมากมายที่อยู่ในฐานข้อมูลไม่สามารถนำมาใช้ประโยชน์ในเชิงวิเคราะห์ เปรียบเทียบ หรือสร้างความรู้เกี่ยวกับการดำเนินธุรกิจขององค์กร เพื่อสนับสนุนการวางแผนเชิงกลยุทธ์และการตัดสินใจของผู้บริหารได้อย่างมีประสิทธิภาพ ถึงแม้องค์กรจะได้ทุ่มงบประมาณมากมายในการได้มาซึ่งระบบไอทีเหล่านั้นก็ตาม และการได้มาซึ่งระบบไอทีแต่ละระบบก็อาจจะได้มาต่างเวลากันด้วยเครื่องมือหรือฐานข้อมูลในการจัดเก็บที่ต่างกัน ซึ่งก็เป็นธรรมชาติของการดำเนินการทางธุรกิจอันหลีกเลี่ยงไม่ได้ที่จะเกิดระบบงานใหม่ ๆ และข้อมูลใหม่ ๆ เกิดขึ้นอยู่ตลอดเวลา
     นอกจากนั้นแล้วข้อมูลเป็นจำนวนมากที่อยู่ในองค์กรก็ไม่ได้จัดเก็บในระบบฐานข้อมูลอย่างเดียว อาจจะจัดเก็บในแผ่นตารางทำการ (Spread Sheet เช่น Excel) หรือแม้แต่ข้อมูลที่เกิดขึ้นเป็นจำนวนมากจากอุปกรณ์ sensor ต่าง ๆ ในองค์กร ข้อมูลใน Weblog ของระบบคอมพิวเตอร์ขององค์กร ข้อมูลใน Social media ต่าง ๆ ที่เกี่ยวข้องกับองค์กร ซึ่งเรารู้จักกันในหัวข้อ “Big data” ซึ่งมีคุณสมบัติ 3V คือมีขนาดใหญ่ (Volume) เกิดขึ้นอย่างรวดเร็ว (Velocity) และมีรูปแบบที่หลากหลาย (Variety)  โดยข้อมูลเหล่านี้จะถูกจัดเก็บและประมวลผลด้วยรูปแบบใหม่ ซึ่งเป็นการประมวลผลแบบกระจาย (distributed)  ใช้ฐานข้อมูลแบบ NOSQL แทนฐานข้อมูลแบบสัมพันธ์ (Relational Database) เราจะจัดการและวิเคราะห์ข้อมูลเหล่านี้อย่างไร ?
     เนื่องด้วยสารสนเทศหรือความรู้เกี่ยวกับการดำเนินธุรกิจที่จำเป็นต้องใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจต้องมาจากข้อมูลหลายแหล่ง และต้องได้มาในเวลาอันรวดเร็ว ในรูปแบบที่ผู้บริหารเข้าใจได้ง่าย และสามารถดูสารสนเทศที่ต้องการได้หลายมุมมองตามความต้องการ และดูข้อมูลย้อนหลังได้สำหรับการวิเคราะห์ เปรียบเทียบ ซึ่งสารสนเทศที่เกิดจากระบบไอทีแต่ละระบบไม่สามารถตอบโจทย์ได้  ดังนั้นองค์กรจึงมีความจำเป็นต้องพัฒนาระบบคลังข้อมูล (data warehouse)  และพัฒนาระบบสารสนเทศอัจฉริยะทางธุรกิจ (Business Intelligence หรือ BI) เพื่อให้ได้สารสนเทศแบบอัตโนมัติที่ผู้บริหารระดับสูงใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจ

 

   การพัฒนาระบบ BI ให้ประสบความสำเร็จจำเป็นต้องมีทีมพัฒนาจาก 3 กลุ่มคือ 
1)  ผู้ดูแลฐานข้อมูล หรือ DBA
2)  นักวิเคราะห์ข้อมูล หรือ Data Analyst และ 
3)  นักวิเคราะห์ธุรกิจ หรือ Business Analyst
และที่จำเป็นอย่างยิ่งคือต้องมี Application Software ที่ใช้งานง่าย ไม่ซับซ้อน มาเป็นตัวช่วยเพราะการพัฒนา BI Solution เพื่อตอบโจทย์ธุรกิจเพื่อการแข่งขันได้ต้องสามารถได้ Solution ที่ต้องการทันต่อการใช้งาน

     Pentaho BI Suite (http://www.pentaho.com/) เป็น Open Source BI Application Software ที่ใช้ Java technology และเป็นที่สนใจอย่างกว้างขวาง หลังจากได้รับรางวัล Bossie Awards 2010: The best open source applications โดย Pentaho ได้มีการพัฒนาชุดซอฟต์แวร์นี้เชิงรุกอย่างต่อเนื่อง  และได้มีการจัดประชุม Pentaho World เป็นประจำทุกปี (https://www.pentahoworld.com/)
     จุดเด่นอีกประการหนึ่งของ Pentaho Business Analytic Platform คือ รองรับการทำงานกับข้อมูลที่หลากหลาย ทั้งฐานข้อมูล NOSQL การประมวลผล big data ด้วย Hadoop และการวิเคราะห์ข้อมูลด้วย Weka, R, และ Spark  อีกทั้งเป็นระบบ Open Source ที่ติดตั้งง่าย ใช้งานง่าย มีทั้งระบบที่เป็น  Community Edition (Pentaho CE) ซึ่งไม่มีค่าใช้จ่ายด้านซอฟต์แวร์ และระบบ Enterprise Edition (Pentaho EE) ซึ่งเพิ่ม features ต่างๆ มากขึ้นจากระบบ Community Edition โดยมีบริษัท Hitachi Data Systems (เจ้าของ Pentaho ตั้งแต่กลางปี 2015) และมีบริษัทที่เป็น Value added distributorในประเทศไทยด้วย ซึ่งนับเป็นโอกาสดีสำหรับการช่วยสนับนุนการพัฒนาระบบสารสนเทศเชิงกลยุทธ์เพื่อมุ่งสู่เศรษฐกิจดิจิทัล (Digital Economy) สำหรับประเทศไทย  ดังนั้น Pentaho Business Analytic Platform จึงเป็นทางเลือกที่คุ้มค่าที่จะนำมาใช้พัฒนาระบบ Business Intelligence และ Data Science in Business ขององค์กร


หลักสูตรที่เปิดอบรม
หลักสูตร 1: Pentaho BI: From Business Intelligence to Data Science (อบรมวันพฤหัส-เสาร์ที่ 30 พฤศจิกายน – 2 ธันวาคม 2560) หลักสูตรนี้เหมาะสำหรับนักพัฒนาระบบสารสนเทศหรือนักวิเคราะห์ข้อมูลทางธุรกิจ

วันที่ 1 – วันที่ 2 ปูพื้นฐานหลักของการพัฒนาระบบ Business Intelligence เป็นการนำเสนอข้อมูลแบบ Descriptive อัตโนมัติ โดยใช้เครื่องมือหลัก 3 ตัว คือ Schema Workbench สำหรับสร้าง OLAP Cube, Data Integration สำหรับทำ ETL (Extract Transform and Load), และ Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard

วันที่ 3  การทำเหมืองข้อมูลด้วย Weka โดยปูพื้นด้วยตัวอย่างข้อมูลของ Weka จากนั้นใช้ Weka วิเคราะห์ข้อมูลของโจทย์งานวิจัย “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor” ที่ http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846 ซึ่งยังไม่เป็นระบบอัตโนมัติ ให้เป็นระบบ BI อัตโนมัติ ด้วย Pentaho โดยใช้ Weka และ deploy model โดยใช้ Pentaho Weka Scoring Plugin Data Science Pack ของ Pentaho Enterprise Edition

หลักสูตร 2: Big Data Workshop with Pentaho Hadoop & Spark (อบรมวันจันทร์-พุธที่ 4 -6 ธันวาคม 2560) หลักสูตรนี้เหมาะสำหรับนักไอทีที่เป็น Data Scientist/Data Engineer และ Computer System Engineer ที่มีพื้นฐานการใช้ Linux command line มาบ้าง

วันที่ 1: การวิเคราะห์ big data ด้วย Hadoop และ Pentaho-Hadoop ด้วยโจทย์ข้อมูลของ Web log โดยใช้ Pentaho Data Integration ซึ่งไม่ต้องเขียน JAVA Map-Reduce และการนำเสนอผลการวิเคราะห์ใน Pentaho OLAP Cube, การใช้งาน Hive และ HBase โดยใช้ Virtual Machine ที่ติดตั้ง CentOS, JAVA, PostgreSQL, Pentaho CE, Hadoop (version 1) เรียบร้อยแล้ว เน้นการใช้งานสำหรับ Data Scientist

วันที่ 2: การติดตั้ง Hadoop Cluster (Hadoop version 2) ด้วย Cloudera และทดสอบการใช้งาน การ run WordCount ด้วย Java Map-Reduce, Pig การวิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem การติดตั้ง Hive และทดสอบการใช้งาน การใช้งาน Pentaho ร่วมกับ Hive การใช้งาน Hue – Web UI

วันที่ 3: ทบทวนหลักการของ Big Data Technology ด้วยปฏิบัติการ Hadoop2.7 บน Linux YARN Framework และ Spark in-memory Technology การนำ Big Data ไปใช้ในองค์กร และการเตรียมความพร้อม จะมีการแบ่งกลุ่มระดมสมองเพื่อกระตุ้นให้เกิดความคิดสร้างสรรค์และสามารถนำความรู้ไปประยุกต์ใช้จริง
หมายเหตุ สามารถดูรายละเอียดกำหนดการอบรมได้ที่เว็บสมาคม www.tatsc.or.th


วัตถุประสงค์ 

  • เพื่อให้ผู้เข้าอบรมได้รับความรู้และความเข้าใจถึงหลักการของระบบ BI และการวิเคราะห์ข้อมูล
  • เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการในกระบวนการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
  • เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการทำเหมืองข้อมูลสร้างโมเดลพยากรณ์ และการนำโมเดลไปใช้
  • เพื่อให้เข้าอบรมได้เข้าใจหลักการและปฏิบัติการวิเคราะห์ข้อมูลขนาดใหญ่ (big data) พร้อมติดตั้งซอฟต์แวร์ในส่วนต่าง ๆ
  • เพื่อให้ผู้เข้าอบรมสามารถนำซอฟต์แวร์ Open Source Pentaho BI Suite, Weka, Hadoop, Spark ไปประยุกต์ใช้งานได้
  • เพื่อสร้างเครือข่ายผู้ใช้งาน Pentaho, Hadoop & Spark ที่จะร่วมมือ แลกเปลี่ยน และช่วยเหลือซึ่งกันและกัน


หลักสูตรนี้เหมาะสำหรับ

  • ผู้ที่ต้องการเรียนรู้หลักและวิธีการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
  • ผู้ที่ต้องการเรียนรู้หลักการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
  • นักไอทีหรือผู้สอนไอที นักสถิติ และนักธุรกิจที่สนใจไอที
  • ผู้บริหาร เจ้าของหน่วยงาน เจ้าหน้าที่วางแผนเชิงกลยุทธ์ ติดตามนโยบายขององค์กร

จำนวนรับเข้าอบรมและคุณสมบัติของผู้เข้าอบรม 
รับจำนวนจำกัด  หลักสูตรละ 30 คน
โดยผู้สมัครต้องนำคอมพิวเตอร์โน้ตบุคของตนเองมา ซึ่งต้องมีคุณสมบัติดังนี้

 

RAM: at least 8 GB
Hard drive space: at least 30 GB free space
Processor: at least Core i5 
OS: Windows7 or higher 64 bits
สำหรับหลักสูตร 2 ถ้ามีได้ spec. ที่สูงกว่า เช่น RAM 12 – 16 GB ก็จะดี

 

วิธีการอบรม
บรรยายภาพรวมของทฤษฎีและหลักการที่เกี่ยวข้อง  สำหรับภาคปฏิบัติการวิทยากรจะสาธิตตามคู่มือ Step by step  และให้ผู้เข้าอบรมปฏิบัติตาม (เน้นปฏิบัติการเพื่อให้ได้ Solution ที่ใช้งานได้จริง)
โจทย์ที่ใช้ปฏิบัติการจะเป็นตัวอย่างและข้อมูลที่ต่อเนื่องกัน (อบรมแบบ Problem based)  

ค่าสมัครในการอบรม
ค่าลงทะเบียน ซึ่งจะมีเอกสารการอบรม ซอฟต์แวร์ที่ใช้อบรมทั้งหมด ได้แก่ Pentaho BI Suite ทั้ง Enterprise Edition และ Community Edition, Java, PostgreSQL, Weka, Cloudera Hadoop, Hadoop 2,7 & Spark และ Utilities อื่น ๆ ที่จำเป็น พร้อมกระเป๋าเอกสารมอบให้ และรวมอาหารกลางวัน & อาหารว่าง เช้า-บ่าย ทุกวันอบรม

หลักสูตร 1 (3 วัน): คนละ 13,000 บาท 
หลักสูตร 2 (3 วัน): คนละ 13,000 บาท 
หลักสูตร 1 และหลักสูตร 2 (6 วัน) คนละ 22,000 บาท  


Promotion พิเศษ: สมัครและชำระค่าอบรมภายในวันที่ 16 พฤศจิกายน 2560  
1.ได้ส่วนลดพิเศษ 10% สำหรับบุคคลทั่วไป
2.ได้ส่วนลดพิเศษ 20% สำหรับ
    ก. ผู้ที่เคยเข้าอบรมกับสมาคมแล้วในการจัดการอบรมที่ผ่านมาของสมาคมฯ
    ข. เป็นสมาชิกสมาคม (สมัครสมาชิกได้ที่เว็บสมาคม http://www.tatsc.or.th
    ค. เป็นนิสิตนักศึกษาที่กำลังเรียนอยู่ หรืออาจารย์มหาวิทยาลัยที่สอนอยู่

หลักสูตร 1 หรือ 2 (3 วัน): คนละ 13,000 บาท (ส่วนลด 10% เหลือ 11,700, 20% เหลือ 10,400)
หลักสูตร 1 และ 2 (6 วัน): คนละ 22,000 บาท (ส่วนลด 10% เหลือ 19,800, 20% เหลือ 17,600)


หมายเหตุ ราคานี้เป็นราคาสุทธิแล้ว (เนื่องจากสมาคมฯ ไม่ต้องจดทะเบียนภาษีมูลค่าเพิ่ม) 


การสมัครเข้าอบรม
โปรดกรอกรายละเอียดของผู้เข้าอบรมที่เว็บสมาคม www.tatsc.or.th และชำระค่าสมัคร โดยจ่ายเข้า บัญชีธนาคารของสมาคมฯ ดังนี้:

 

ธนาคารกรุงเทพ สาขาจามจุรี สแควร์ บัญชีเงินฝากสะสมทรัพย์ เลขที่: 939-0-14153-0 
ชื่อบัญชี: สมาคม ศูนย์วิชาการไทย-ออสเตรเลีย

และส่งสำเนา Pay-in slip มาทาง email : This email address is being protected from spambots. You need JavaScript enabled to view it.
เมื่อทางสมาคมได้รับเอกสารแล้วจะตอบกลับทาง email

 

อนึ่ง สำหรับผู้เข้าอบรมที่ต้องหักภาษี ณ ที่จ่าย  
โปรดออกเอกสารการหักภาษี ณ ที่จ่าย ตามรายละเอียดดังนี้ สมาคมศูนย์วิชาการไทย-ออสเตรเลีย  
เลขประจำตัวผู้เสียภาษี 0993-000-178998 
ที่อยู่  968  ชั้น  9  อาคารอื้อจือเหลียง ถนนพระราม 4  แขวงสีลม เขตบางรัก กรุงเทพมหานคร 10500

หมายเหตุ :
1) สมาคมขอสงวนสิทธิ์ที่จะยกเลิกการอบรมในกรณีที่มีเหตุขัดข้องสุดวิสัย โดยทางสมาคมฯ จะโอนเงินคืนให้ท่านในกรณีที่ท่านได้มีการชำระมาก่อนล่วงหน้า
2) สมาคมขออนุญาตที่จะออกใบเสร็จรับเงินให้กับผู้อบรมในวันอบรม
3) หากมีข้อสงสัยประการใด โปรดติดต่อสมาคมที่ e-mail: This email address is being protected from spambots. You need JavaScript enabled to view it.  
หรือที่ ผศ.ดร.สุณี  รักษาเกียรติศักดิ์  089-211-6224


 

 

 

กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, Weka, Hadoop & Spark:

From Business Intelligence to Data Science

 

 

หลักสูตร 1: Pentaho BI

ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine สุขุมวิท 23 กรุงเทพฯ

คณะวิทยากร: ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์, ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์,
อาจารย์เรืองศักดิ์ ตระกูลพุทธิรักษ์

วันพฤหัสบดีที่ 30 พฤศจิกายน 2560
08:00 – 08:45 น.   ลงทะเบียน สำหรับหลักสูตร 1
09:00 – 10:10 น.   หัวข้อที่ 1: แนวคิด หลักการ และประโยชน์ ของ “Business Intelligence”
         ภาพรวมของระบบ Pentaho Business Intelligence (Pentaho BI)
         ติดตั้งระบบ Pentaho Community Edition (Pentaho CE)
         (ติดตั้ง Java, ฐานข้อมูล PostgreSQL, Pentaho CE, Design-Tools)
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
10:10 – 10:30 น.   หยุดพักรับประทานอาหารว่าง
10:30 – 12:00 น.   หัวข้อที่ 2: โจทย์สำหรับทำ BI:
         กรณีศึกษาของระบบงานบุคคล (Human Resource)
         การออกแบบ Data Model
         การนำข้อมูลสำหรับการวิเคราะห์ (ที่ ETL แล้ว) เข้าฐานข้อมูล Postgres
12:00 – 13:00 น.   หยุดพักรับประทานอาหารกลางวัน
13:00 – 14:00 น.   หัวข้อที่ 3: ทดลองใช้ระบบในฐานะผู้ใช้ (Users)
         Reporting, Analysis (OLAP Cube), Dashboard
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
14:00 – 15:00 น.   หัวข้อที่ 4: หลักการแปละปฏิบัติการ: การใช้ Schema Workbench สำหรับสร้าง OLAP Cube
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00 – 15:20 น.   หยุดพักรับประทานอาหารว่าง
15:20 – 17:00 น.   หัวข้อที่ 4: หลักการและปฏิบัติการ: การใช้ Schema Workbench (ต่อ)

วันศุกร์ที่ 1 ธันวาคม 2560
09:00 - 10.10 น.   หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Data Integration สำหรับจัดเตรียมข้อมูลสำหรับการวิเคราะห์ Extract Transform & Load (ETL)
โดย อาจาร์เรืองศักดิ์ ตระกูลพุทธิรักษ์ และคณะ
10:10 – 10:30 น.   หยุดพักรับประทานอาหารว่าง
10:30 – 12:00 น.   หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Data Integration (ต่อ)
12:00 – 13:00 น.   หยุดพักรับประทานอาหารกลางวัน
13:00 – 15:00 น.   หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00 – 15:20 น.   หยุดพักรับประทานอาหารว่าง
15:20 – 17:00 น.   หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE) (ต่อ)

วันเสาร์ที่ 2 ธันวาคม 2560 โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
08:30 - 09:00 น.   ติดตั้ง PentahoEE
09:00 – 10.10 น.   หัวข้อที่ 7: โจทย์สำหรับทำ BI “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor” ที่ http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846
         - ออกแบบ Data model สำหรับการวิเคราะห์
         - นำข้อมูล ATutor_wh (ที่ ETL แล้ว) เข้าฐานข้อมูล PostgreSQL
         - ทดสอบ ATutor Pentaho Solutions: Report, Cube, Dashboard
10:10 – 10:30 น.   รับประทานอาหารว่าง
10:30 – 12:00 น.   หัวข้อที่ 7: กรณีศึกษา ATutor (ต่อ)
12:00 – 13:00 น.   รับประทานอาหารกลางวัน
13:00 – 15.00 น.   หัวข้อที่ 8: การทำเหมืองข้อมูลด้วย Weka:
         Classification, Prediction, Association, Clustering
15:00 – 15:20 น.   รับประทานอาหารว่าง
15:20 – 17:00 น.   หัวข้อที่ 9: การวิเคราะห์ข้อมูลของโจทย์สำหรับทำ BI “การทำเหมืองข้อมูล ATutor” โจทย์ประเภท Clustering และการนำโมเดล Weka เข้า Pentaho Data Integration (ETL)
         - แจกประกาศนียบัตร

สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ

 

หลักสูตร 2: Big Data Workshop with Pentaho Hadoop & Spark
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine Executive Suites สุขุมวิท 23 กรุงเทพฯ

คณะวิทยากร: ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์, ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์,
อาจารย์เรืองศักดิ์ ตระกูลพุทธิรักษ์, อาจารย์ดนัยรัฐ ธนบดีธรรมจารี

วันจันทร์ที่ 4 ธันวาคม 2560
08:00 – 08:45 น.   ลงทะเบียน สำหรับหลักสูตร 2
09:00 – 10.10 น.   หัวข้อที่ 1: แนวคิดและหลักการของการวิเคราะห์ big data ด้วย Hadoop และ
         Pentaho-Hadoop (Pentaho Data Science Pack)
โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี รักษาเกียรติศักดิ์ และคณะ
10:10 – 10:30 น.   รับประทานอาหารว่าง
10:30 – 12.00 น.   หัวข้อที่ 2: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop
12:00 – 13.00 น.   รับประทานอาหารกลางวัน
13:00 – 15.00 น.   หัวข้อที่ 3: การใช้งาน Hive, Hbase
โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00 – 15:20 น.   รับประทานอาหารว่าง
15:20 – 17.00 น.   หัวข้อที่ 4: การสร้าง Transformation ของการวิเคราะห์ Web log ด้วย Pentaho-Hadoop

วันอังคารที่ 5 ธันวาคม 2560 โดย อาจาร์เรืองศักดิ์ ตระกูลพุทธิรักษ์ และคณะ
09:00 – 10.10 น.   หัวข้อที่ 5: การติดตั้ง Cloudera Hadoop Cluster และทดสอบการใช้งาน
10:10 – 10:30 น.   รับประทานอาหารว่าง
10:30 – 12.00 น.   หัวข้อที่ 6: การ run WordCount ด้วย Java Map-Reduce, Pig
12:00 – 13.00 น.   รับประทานอาหารกลางวัน
13:00 – 15.00 น.   หัวข้อที่ 7: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster
15:00 – 15:20 น.   รับประทานอาหารว่าง
15:20 – 17.00 น.   หัวข้อที่ 8: การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem

วันพุธที่ 6 ธันวาคม 2560 โดย อาจารย์ดนัยรัฐ ธนบดีธรรมจารี และคณะ
9:00 – 10.15 น.   หัวข้อที่ 9: ทบทวนหลักการของ Big Data Technology
10:15 – 10:30 น.   รับประทานอาหารว่าง
10:30 – 12.00 น.   หัวข้อที่ 10 Hands on Lab:
         - ติดตั้ง Hadoop2.7 บน Linux
         - Hadoop Distributed File System (HDFS)
         - YARN Framework
         - SPARK In-Memory Technology
12:00 – 13.00 น.   รับประทานอาหารกลางวัน
13:00 – 15.00 น.   หัวข้อที่ 10: Hands on Lab (ต่อ)
15:00 – 15:15 น.   รับประทานอาหารว่าง
15:15 – 17.00 น.   หัวข้อที่ 11: แบ่งกลุ่มย่อย ระดมสมองการประยุกต์ใช้ Big Data ในองค์กร

แผนที่โรงแรม Jasmine (อาคารจัสมิน)