การอบรมเชิงปฏิบัติการ เรื่อง Data Analytics with Pentaho BI, Weka, R, and Hadoop From Business Intelligence to Data Science




 

     สมาคมศูนย์วิชาการไทย – ออสเตรเลีย ซึ่งได้ก่อตั้งขึ้นในประเทศไทยมากว่า 30 ปี เป็นองค์กรที่ไม่แสวงหาผลกำไร และมีความร่วมมือกับหน่วยงานต่าง ๆ ในการจัดกิจกรรมการสัมมนา/อบรมเชิงปฏิบัติการทางวิชาการต่างๆ  ได้จัดอบรมเชิงปฏิบัติการเกี่ยวกับ Business Intelligence โดยใช้ Open Source Pentaho Business Analytic Platform  ขึ้นปีที่ 6 แล้ว  โดยคณะวิทยากรผู้เชี่ยวชาญ นำโดย ผศ. ดร. สุณี รักษาเกียรติศักดิ์ ศิษย์เก่าออสเตรเลีย  โดยได้จัดโครงการอบรมครั้งแรกในรุ่นที่ 1 ในวันที่ 18-20 กุมภาพันธ์ 2554 (2011) และได้รับการตอบรับอย่างดีจากหน่วยงานต่าง ๆ ทั้งภาครัฐ เอกชน และสถาบันการศึกษา สมาคมฯ ได้จัดต่อเนื่องมาจนปัจจุบัน โดยได้มีการปรับเนื้อหาหลักสูตรตามความก้าวหน้าของเทคโนโลยี และเพิ่มเนื้อหาเข้มข้นมากขึ้นจากการศึกษาเพิ่มเติมอย่างต่อเนื่อง โดยจัดปีละ 2 ครั้งเท่านั้น ในการจัดอบรม 2 ครั้งที่ผ่านมาเมื่อวันที่ 9-14 พฤศจิกายน 2558 และ 13-18 มิถุนายน 2559 มีผู้สมัครเต็มจำนวนและล้นทั้งสองหลักสูตร
     ในการอบรมครั้งนี้สมาคมฯ ร่วมกับบริษัท ClusterKit (www.clusterkit.co.th) จัดการอบรม 2 หลักสูตร คือ หลักสูตร 1: Pentaho BI Basic เป็นพื้นฐานของการวิเคราะห์ข้อมูลหลักด้วย Descriptive Modeling แต่เป็นการนำเสนอผลลัพธ์ของการวิเคราะห์แบบอัตโนมัติในรูปแบบของ Report, Analysis OLAP Cube, และ Dashboard  เป็นจุดเริ่มต้นของการพัฒนาระบบ Business Intelligence  
หลักสูตร 2 Data Analytics with R, Weka, Pentaho, and Hadoop: From Business Intelligence to Data Science  เน้นพื้นฐานด้านการวิเคราะห์ข้อมูลทางสถิติ (ซึ่งนักไอทีขาด) ด้วยโปรแรกม R สำหรับ Exploratory Data Analysis (EDA) และการวิเคราะห์ข้อมูลด้วยวิธีการ Machine Learning หรือการทำเหมืองข้อมูล (ซึ่งนักสถิติขาด) ด้วยโปรแกรม Weka สำหรับการวิเคราะห์ข้อมูลแบบสร้างตัวแบบการพยากรณ์ (Predictive Modeling)  อันจะเป็นพื้นฐานสำคัญของวิทยาการข้อมูลในทางธุรกิจ (Data Science in Business) ซึ่งกำลังเป็นศาสตร์ที่กำลังเป็นที่ต้องการ  โดยโมเดลที่ได้ต้องสามารถนำไปใช้ได้จริงในการดำเนินธุรกิจ (Prescriptive) ผ่านระบบ Pentaho BI ไม่ใช่เพียงได้ผลลัพธ์แค่รู้แต่ต้องสามารถนำไปใช้ได้อย่างต่อเนื่องแบบอัตโนมัติ (deploy model) กับข้อมูลชุดใหม่ ในหลักสูตร 2 นี้ยังได้เพิ่มโจทย์การวิเคราะห์ข้อมูลขนาดใหญ่ (big data) ด้วย Pentaho-Hadoop โดยนักวิเคราะห์ไม่ต้องเขียนโปรแกรมภาษา JAVA สำหรับการวิเคราะห์ด้วย Map-Reduce แต่ Pentaho จะมี Data Science Pack ซึ่งเป็น JAVA API อำนวยความสะดวกให้ 
     นอกจากนั้นแล้ว ในการอบรมครั้งนี้ยังได้จัดให้มีการบรรยายพิเศษและสาธิตหัวข้อพิเศษ  จากวิทยากรผู้ชำนาญการอีกด้วย 
     
การอบรมจะจัดขึ้นในวันจันทร์-พุธ ที่ 19-21 ธันวาคม 2559 สำหรับหลักสูตร 1  และ
วันพฤหัสบดี-เสาร์ที่ 22-24 ธันวาคม 2559 สำหรับหลักสูตร 2 ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine Executive Suites  สุขุมวิท 23 กรุงเทพฯ (BTS สถานีอโศก หรือ MRT สถานีสุขุมวิท)  โทร.  02-204-5885 
ผู้สนใจสามารถดูรายละเอียดและสมัครได้ที่เว็บสมาคมฯ www.tatsc.or.th
 

 
หลักการและเหตุผล
     ในการดำเนินธุรกิจขององค์กรจำเป็นต้องอาศัยระบบไอทีอย่างหลีกเลี่ยงไม่ได้ ผลจากการใช้งาน/การประมวลผลรายการ (operational transaction processing) ของระบบไอทีทำให้เกิดระบบฐานข้อมูลขนาดใหญ่ขององค์กร ซึ่งนับเป็นสินทรัพย์อันมีค่าขององค์กร แต่เป็นที่น่าเสียดายที่ข้อมูลมากมายที่อยู่ในฐานข้อมูลไม่สามารถนำมาใช้ประโยชน์ในเชิงวิเคราะห์ เปรียบเทียบ หรือสร้างความรู้เกี่ยวกับการดำเนินธุรกิจขององค์กร เพื่อสนับสนุนการวางแผนเชิงกลยุทธ์และการตัดสินใจของผู้บริหารได้อย่างมีประสิทธิภาพ ถึงแม้องค์กรจะได้ทุ่มงบประมาณมากมายในการได้มาซึ่งระบบไอทีเหล่านั้นก็ตาม และการได้มาซึ่งระบบไอทีแต่ละระบบก็อาจจะได้มาต่างเวลากันด้วยเครื่องมือหรือฐานข้อมูลในการจัดเก็บที่ต่างกัน ซึ่งก็เป็นธรรมชาติของการดำเนินการทางธุรกิจอันหลีกเลี่ยงไม่ได้ที่จะเกิดระบบงานใหม่ ๆ และข้อมูลใหม่ ๆ เกิดขึ้นอยู่ตลอดเวลา
     นอกจากนั้นแล้วข้อมูลเป็นจำนวนมากที่อยู่ในองค์กรก็ไม่ได้จัดเก็บในระบบฐานข้อมูลอย่างเดียว อาจจะจัดเก็บในแผ่นตารางทำการ (Spread Sheet เช่น Excel) หรือแม้แต่ข้อมูลที่เกิดขึ้นเป็นจำนวนมากจากอุปกรณ์ sensor ต่าง ๆ ในองค์กร ข้อมูลใน Weblog ของระบบคอมพิวเตอร์ขององค์กร ข้อมูลใน Social media ต่าง ๆ ที่เกี่ยวข้องกับองค์กร ซึ่งเรารู้จักกันในหัวข้อ “Big data” ซึ่งมีคุณสมบัติ 3V คือมีขนาดใหญ่ (Volume) เกิดขึ้นอย่างรวดเร็ว (Velocity) และมีรูปแบบที่หลากหลาย (Variety)  โดยข้อมูลเหล่านี้จะถูกจัดเก็บและประมวลผลด้วยรูปแบบใหม่ ซึ่งเป็นการประมวลผลแบบกระจาย (distributed)  ใช้ฐานข้อมูลแบบ NOSQL แทนฐานข้อมูลแบบสัมพันธ์ (Relational Database) เราจะจัดการและวิเคราะห์ข้อมูลเหล่านี้อย่างไร  
     เนื่องด้วยสารสนเทศหรือความรู้เกี่ยวกับการดำเนินธุรกิจที่จำเป็นต้องใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจต้องมาจากข้อมูลหลายแหล่ง และต้องได้มาในเวลาอันรวดเร็ว ในรูปแบบที่ผู้บริหารเข้าใจได้ง่าย และสามารถดูสารสนเทศที่ต้องการได้หลายมุมมองตามความต้องการ และดูข้อมูลย้อนหลังได้สำหรับการวิเคราะห์ เปรียบเทียบ ซึ่งสารสนเทศที่เกิดจากระบบไอทีแต่ละระบบไม่สามารถตอบโจทย์ได้  ดังนั้นองค์กรจึงมีความจำเป็นต้องพัฒนาระบบคลังข้อมูล (data warehouse)  และพัฒนาระบบสารสนเทศอัจฉริยะทางธุรกิจ (Business Intelligence หรือ BI) เพื่อให้ได้สารสนเทศแบบอัตโนมัติที่ผู้บริหารระดับสูงใช้ในการวางแผนเชิงกลยุทธ์และการตัดสินใจ



การพัฒนาระบบ BI ให้ประสบความสำเร็จจำเป็นต้องมีทีมพัฒนาจาก 3 กลุ่มคือ 
1) ผู้ดูแลฐานข้อมูล หรือ DBA
2) นักวิเคราะห์ข้อมูล หรือ Data Analyst และ   
3) นักวิเคราะห์ธุรกิจ หรือ Business Analyst

     และที่จำเป็นอย่างยิ่งคือต้องมี Application Software ที่ใช้งานง่าย ไม่ซับซ้อน มาเป็นตัวช่วย  เพราะการพัฒนา BI Solution เพื่อตอบโจทย์ธุรกิจเพื่อการแข่งขันได้ต้องสามารถได้ Solution ที่ต้องการทันต่อการใช้งาน
    
     Pentaho BI Suite (http://www.pentaho.com/) เป็น Open Source BI Application Software ที่ใช้ Java technology และเป็นที่สนใจอย่างกว้างขวาง หลังจากได้รับรางวัล Bossie Awards 2010: The best open source applications โดย Pentaho ได้มีการพัฒนาชุดซอฟต์แวร์นี้เชิงรุกอย่างต่อเนื่อง  และได้มีการจัดประชุม Pentaho World เป็นประจำทุกปี (https://www.pentahoworld.com/) นอกจากนั้นแล้วในการวิเคราะห์ข้อมูลทางธุรกิจยังมีซอฟต์แวร์ Open Source ที่เป็นที่นิยมในการวิเคราะห์ข้อมูลทางสถิติ (Statistical data analysis) และการทำเหมืองข้อมูล (Data mining) เช่น โปรแกรม R และโปรแกรม Weka  เป็นต้น  

     จุดเด่นอีกประการหนึ่งของ Pentaho Business Analytic Platform คือ รองรับการทำงานกับข้อมูลที่หลากหลาย ทั้งฐานข้อมูล NOSQL การประมวลผล big data ด้วย Hadoop และการวิเคราะห์ข้อมูลด้วย Weka, R, และ Spark  อีกทั้งเป็นระบบ Open Source ที่ติดตั้งง่าย ใช้งานง่าย มีทั้งระบบที่เป็น  Community Edition (Pentaho CE) ซึ่งไม่มีค่าใช้จ่ายด้านซอฟต์แวร์ (และสามารถใช้งานจริงได้ดี โดยมีบริษัทในประเทศไทย เช่น บริษัทโกอิ้งเจ็ส (GoingJesse) ได้ Implement Pentaho ใช้งานให้กับลูกค้ามากว่า 6 ปีแล้ว) และระบบ Enterprise Edition (PentahoEE) ซึ่งเพิ่ม features ต่างๆ มากขึ้นจากระบบ Community Edition โดยมีบริษัท Hitachi Data Systems (เจ้าของ Pentaho ตั้งแต่กลางปี 2015) และมีบริษัทที่เป็น Value added distributorในประเทศไทยด้วย ซึ่งนับเป็นโอกาสดีสำหรับการช่วยสนับนุนการพัฒนาระบบสารสนเทศเชิงกลยุทธ์เพื่อมุ่งสู่เศรษฐกิจดิจิทัล (Digital Economy) สำหรับประเทศไทย  ดังนั้น Pentaho Business Analytic Platform จึงเป็นทางเลือกที่คุ้มค่าที่จะนำมาใช้พัฒนาระบบ Business Intelligence และ Data Science in Business ขององค์กร

หลักสูตรที่เปิดอบรม
     ในการอบรมครั้งนี้สำหรับนักพัฒนาระบบ (Developer) โดยจะใช้ Pentaho CE ซึ่งไม่มีค่าใช้จ่ายด้านซอฟต์แวร์สำหรับหลักสูตร 1 และ Pentaho EE สำหรับหลักสูตร 2 คือ: 

หลักสูตร 1: Pentaho BI Basic (อบรมวันจันทร์-พุธ ที่ 19-21 ธันวาคม 2559) 
เป็นการปูพื้นฐานหลักของการพัฒนาระบบ Business Intelligence เป็นการนำเสนอข้อมูลแบบ Descriptive อัตโนมัติ โดยใช้เครื่องมือหลัก 4 ตัวคือ Report Designer สำหรับสร้างรายงาน, Schema Workbench สำหรับสร้าง OLAP Cube, Data Integration สำหรับทำ ETL (Extract Transform and Load), Community Dashboard Editor (CDE) สำหรับสร้าง Dashboard  และเครื่องมือเสริมอีก 2 ตัว คือ Meta Data Editor สำหรับสร้าง Business View ของข้อมูลให้กับผู้ใช้แต่ละกลุ่ม และ Aggregation Designer สำหรับการ Aggregate ข้อมูลจาก OLAP Cube เพื่อเพิ่มประสิทธิภาพในการแสดงผลข้อมูล 

หลักสูตร 2: Data Analytics with Pentaho BI, Weka, R, and Hadoop: From Business Intelligence to Data Science (อบรมวันพฤหัส-เสาร์ที่ 22-24 ธันวาคม 2559)   
การวิเคราะห์ข้อมูลด้วยเครื่องมือที่หลากหลาย เน้นหลักการของวิเคราะห์ Predictive model  การนำโมเดลไปใช้อัตโนมัติ (Prescriptive)  และการประมวลผล big data  ตามหลักการของ Data Science บน Pentaho Business Analytic Platform:  

วันที่ 1 การค้นหาความรู้ (Knowledge Discovery) ด้วยวิธีการวิเคราะห์ข้อมูลทางสถิติด้วยโปรแกรม R และการทำเหมืองข้อมูลด้วย Weka โดยปูพื้นด้วยตัวอย่างข้อมูลของ Weka  จากนั้นใช้ R และ Weka วิเคราะห์ข้อมูลของโจทย์งานวิจัย “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor”  ที่  http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846  ซึ่งยังไม่เป็นระบบอัตโนมัติ  ให้เป็นระบบ BI อัตโนมัติ ด้วย Pentaho โดยใช้ Weka Interface 3 แบบคือ Explorer, Experimenter, Knowledge Flow และ deploy model โดยใช้ Pentaho Weka Scoring Plugin 
วันที่ 2  การวิเคราะห์ big data ด้วย Hadoop และ Pentaho-Hadoop ด้วยโจทย์ข้อมูลของ Web log  ใช้ Pentaho Data Integration โดยไม่ต้องเขียน JAVA  และการนำเสนอผลการวิเคราะห์ใน Pentaho OLAP Cube, การใช้งาน Hive และ Hbase 
วันที่ 3: การติดตั้ง Hadoop และ Hadoop Ecosystem (version2) บน Hadoop Cluster ด้วย Cloudera 
run WordCount ด้วย Java Map-Reduce, Pig การใช้ Flume เก็บข้อมูล weblog ลง Hadoop ทดสอบ Pentaho-Hadoop ผ่าน Pentaho Data Integration วิเคราะห์ข้อมูล Weblog บน Hadoop Cluster โดยไม่ต้องเขียนโปรแกรม Java 

ทั้งนี้ผู้เข้าอบรมหลักสูตร 2 ควรผ่านการอบรมหลักสูตร 1 มาก่อน (จากการอบรมรุ่นใดก็ได้) 

วัตถุประสงค์ 
•    เพื่อให้ผู้เข้าอบรมได้รับความรู้และความเข้าใจถึงหลักการของระบบ BI และการวิเคราะห์ข้อมูล
•    เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการในกระบวนการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
•    เพื่อให้ผู้เข้าอบรมได้ฝึกปฏิบัติการวิเคราะห์ข้อมูลทางสถิติ การทำเหมืองข้อมูล และการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
•    เพื่อให้ผู้เข้าอบรมสามารถนำซอฟต์แวร์ Open Source Pentaho BI Suite, Weka, R, Hadoop ไปประยุกต์ใช้งานได้
•    เพื่อสร้างเครือข่ายผู้ใช้งาน Pentaho ประเทศไทย ที่จะร่วมมือ แลกเปลี่ยน และช่วยเหลือซึ่งกันและกัน

หลักสูตรนี้เหมาะสำหรับ 
•    ผู้ที่ต้องการเรียนรู้หลักและวิธีการพัฒนาระบบ BI และการวิเคราะห์ข้อมูล
•    ผู้ที่ต้องการเรียนรู้การวิเคราะห์ข้อมูลด้วยวิธีการทางสถิติ วิธีการทำเหมืองข้อมูลและการวิเคราะห์ข้อมูลขนาดใหญ่ (big data)
•    นักไอทีหรือผู้สอนไอที นักสถิติ และนักธุรกิจที่สนใจไอที
•    ผู้บริหาร เจ้าของหน่วยงาน เจ้าหน้าที่วางแผนเชิงกลยุทธ์ ติดตามนโยบายขององค์กร 


กลุ่มเป้าหมาย
     การอบรมครั้งนี้เหมาะสำหรับนักไอที นักสถิติ ของหน่วยงาน อาจารย์ผู้สอนไอที สอนสถิติ  ผู้บริหาร  หัวหน้าหน่วยงาน   ผู้จัดการทุกระดับ  และบุคลากรที่สนใจจะพัฒนาระบบ BI ของงานที่ตนเองรับผิดชอบ  ผู้เข้าอบรมควรมีความรู้เบื้องต้นเกี่ยวกับฐานข้อมูล และคำสั่ง SQL (แต่ไม่จำเป็นต้องจำคำสั่งได้)  หากไม่มี แต่สนใจจะศึกษาหลักการของ BI ในฐานะ Business Analyst  ควรจะสมัครมากับนักไอทีของหน่วยงาน   

จำนวนรับเข้าอบรมและคุณสมบัติของผู้เข้าอบรม   :  
    รับจำนวนจำกัด  หลักสูตรละ 30 คน  
โดยผู้สมัครต้องนำคอมพิวเตอร์โน้ตบุคของตนเองมา ซึ่งต้องมีคุณสมบัติดังนี้


          RAM: at least 8 GB
          Hard drive space: at least 20 GB
          Processor: at least Core i5 
          OS: Windows7 or higher 64 bits

วิธีการอบรม
    บรรยายภาพรวมของทฤษฎีและหลักการที่เกี่ยวข้อง  สำหรับภาคปฏิบัติการวิทยากรจะสาธิตตามคู่มือ Step by step  และให้ผู้เข้าอบรมปฏิบัติตาม (เน้นปฏิบัติการเพื่อให้ได้ Solution ที่ใช้งานได้จริง)
    โจทย์ที่ใช้ปฏิบัติการจะเป็นตัวอย่างและข้อมูลที่ต่อเนื่องกัน (อบรมแบบ Problem based)  

ค่าสมัครในการอบรม
    ค่าลงทะเบียน ซึ่งจะมีเอกสารการอบรม  ซอฟต์แวร์ที่ใช้อบรมทั้งหมด ได้แก่  Pentaho BI Suite ทั้ง Enterprise Edition และ Community Edition, Java, ฐานข้อมูล MySQL, PostgreSQL, โปรแกรม Weka, โปรแกรม R  โปรแกรม Hadoop และที่เกี่ยวข้อง Utilities อื่น ๆ ที่จำเป็น  พร้อมกระเป๋าเอกสารมอบให้ และรวมอาหารกลางวัน & อาหารว่าง  เช้า-บ่าย ทุกวันอบรม


     หลักสูตร 1 (3 วัน): คนละ 13,000 บาท 
     หลักสูตร 2 (3 วัน): คนละ 13,000 บาท 
     หลักสูตร 1 และหลักสูตร 2 (6 วัน) คนละ 22,000 บาท
 

Promotion พิเศษ: สมัครและชำระค่าอบรมภายในวันที่  7 ธันวาคม 2559  

     1. ได้ส่วนลดพิเศษ 10% สำหรับบุคคลทั่วไป
     2. ได้ส่วนลดพิเศษ 20% สำหรับ
          ก. ผู้ที่เคยเข้าอบรมกับสมาคมแล้วในการจัดการอบรมที่ผ่านมาของสมาคมฯ
          ข. เป็นศิษย์เก่าออสเตรเลีย (ลงทะเบียนสมาชิกได้ที่เว็บสมาคม http://www.tatsc.or.th ) 
          ค. เป็นนิสิตนักศึกษาที่กำลังเรียนอยู่ หรืออาจารย์มหาวิทยาลัยที่สอนอยู่
หลักสูตร 1 หรือ 2 (3 วัน): คนละ 13,000 บาท (ส่วนลด 10% เหลือ 11,700, 20% เหลือ 10,400)
หลักสูตร 1 และ 2 (6 วัน): คนละ 22,000 บาท (ส่วนลด 10% เหลือ 19,800, 20% เหลือ 17,600)
 

การสมัครเข้าอบรม
     โปรดกรอกรายละเอียดของผู้เข้าอบรมที่เว็บสมาคม www.tatsc.or.th และชำระค่าสมัคร
โดยจ่ายเข้า บัญชีธนาคารของสมาคมฯ ดังนี้:

     ธนาคารกรุงเทพ สาขาจามจุรี สแควร์   บัญชีเงินฝากสะสมทรัพย์ เลขที่: 939-0-14153-0 
     ชื่อบัญชี: สมาคม ศูนย์วิชาการไทย-ออสเตรเลีย


และส่งสำเนา Pay-in slip มาทางemail :This email address is being protected from spambots. You need JavaScript enabled to view it.
เมื่อทางสมาคมได้รับเอกสารแล้วจะตอบกลับทาง email  

อนึ่ง สำหรับผู้เข้าอบรมที่ต้องหักภาษี ณ ที่จ่าย  โปรดออกเอกสารการหักภาษี ณ ที่จ่ายตามรายละเอียดดังนี้ สมาคมศูนย์วิชาการไทย-ออสเตรเลีย  เลขประจำตัวผู้เสียภาษี 0993-000-178998 
ที่อยู่  968  ชั้น  9  อาคารอื้อจือเหลียง ถนนพระราม 4  แขวงสีลม เขตบางรัก กรุงเทพมหานคร 10500

หมายเหตุ :      1)  สมาคมขอสงวนสิทธิ์ที่จะยกเลิกการอบรมในกรณีที่มีเหตุขัดข้องสุดวิสัย โดยทางสมาคมฯ จะโอนเงินคืนให้ท่านในกรณีที่ท่านได้มีการชำระมาก่อนล่วงหน้า
            
            2)  สมาคมขออนุญาตที่จะออกใบเสร็จรับเงินให้กับผู้อบรมในวันอบรม
        
                3) หากมีข้อสงสัยประการใด โปรดติดต่อสมาคมที่ e-mail: This email address is being protected from spambots. You need JavaScript enabled to view it.  
หรือที่
ผศ.ดร.สุณี  รักษาเกียรติศักดิ์  089-211-6224

อนึ่งสำหรับผู้บริหารหรือหัวหน้างานที่สนใจจะอบรมในหลักสูตร 1 วัน ในหัวข้อ

“แนวคิดและเครื่องมือในการจัดการข้อมูลเชิงกลยุทธ์
Concepts and Tools for Strategic Data Management: 
From Business Intelligence to Data Science 
with Open Source Pentaho Business Analytic Platform”
ในวันศุกร์ที่ 18 พฤศจิกายน 2559

 
สามารถดูรายละเอียดและสมัครได้ที่เว็บสมาคม www.tatsc.or.th 




กำหนดการอบรมเชิงปฏิบัติการ เรื่อง
Data Analytics with Pentaho BI, R, Weka, and Hadoop
From Business Intelligence to Data Science

หลักสูตร 1: Pentaho BI Basic 
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine Executive Suites  สุขุมวิท 23 กรุงเทพฯ 

วันจันทร์ที่ 19  ธันวาคม 2559  
08:00     –     08:45 น.    ลงทะเบียน สำหรับหลักสูตร 1
09:00     –     10:10 น.    หัวข้อที่ 1: แนวคิด หลักการ และประโยชน์ ของ “Business Intelligence”
                                     ภาพรวมของระบบ Pentaho Business Intelligence (Pentaho BI)

                                     ติดตั้งระบบ Pentaho Community Edition (Pentaho CE)
                                     (ติดตั้ง Java, ฐานข้อมูล PostgreSQL, Pentaho CE, Design-Tools)
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
10:10     –     10:30 น.    หยุดพักรับประทานอาหารว่าง 
10:30     –     12:00 น.    หัวข้อที่ 2: โจทย์สำหรับทำ BI: 

                                     กรณีศึกษาของระบบงานบุคคล (Human Resource) 
                                     การออกแบบ Data Model 
                                     การนำข้อมูลสำหรับการวิเคราะห์ (ที่ ETL แล้ว) เข้าฐานข้อมูล Postgres 
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
12:00     –     13:00 น.    หยุดพักรับประทานอาหารกลางวัน
13:00     –     14:00 น.    หัวข้อที่ 3: ทดลองใช้ระบบในฐานะผู้ใช้ (Users)  

                                     Reporting, Analysis (OLAP Cube), Dashboard
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
14:00     –     15:00 น.     หัวข้อที่ 4: หลักการและปฏิบัติการ: การสร้างรายงาน (Reporting) 

                                     โดยใช้ Report Designer 
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
15:00     –     15:20 น.    หยุดพักรับประทานอาหารว่าง
15:20     –     17:00 น.    หัวข้อที่ 4: หลักการและปฏิบัติการ: การสร้างรายงาน (ต่อ)


วันอังคารที่ 20  ธันวาคม 2559  
09:00     
     10.10 น.    หัวข้อที่ 5: หลักการแปละปฏิบัติการ: การใช้ Schema Workbench สำหรับสร้าง OLAP Cube
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์ วิยานนท์ และคณะ
10:10     –     10:30 น.     หยุดพักรับประทานอาหารว่าง
10:30     –     12:00 น.    หัวข้อที่ 5: หลักการและปฏิบัติการ: การใช้ Schema Workbench (ต่อ)
12:00     –     13:00 น.    หยุดพักรับประทานอาหารกลางวัน
13:00     –     15:00 น.    หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration สำหรับจัดเตรียมข้อมูล
สำหรับการวิเคราะห์ Extract Transform & Load (ETL) 
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
15:00     –     15:20 น.    หยุดพักรับประทานอาหารว่าง
15:20     –     17:00 น.    หัวข้อที่ 6: หลักการและปฏิบัติการ: การใช้ Data Integration (ต่อ)

วันพุธที่ 21 ธันวาคม 2559  
09:00     –     10.10 น.    หัวข้อที่ 7: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE) 
สำหรับสร้าง Dashboard
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.วราภรณ์  วิยานนท์ และคณะ
10:10     –     10:30 น.     หยุดพักรับประทานอาหารว่าง
10:30     –     12:00 น.    หัวข้อที่ 7: หลักการและปฏิบัติการ: การใช้ Community Dashboard Editor (CDE)
(ต่อ)
12:00     –     13:00 น.    หยุดพักรับประทานอาหารกลางวัน
13:00     –     14:00 น.    การบรรยายและสาธิต หัวข้อพิเศษ: การวิเคราะห์และออกแบบระบบ BI

                                     โดย คุณอิทธิเชษฐ์ วิสัยทัศนะกูล  กรรมการผู้จัดการบริษัทโกอิ้งเจ็ส
14:00     –     15:00 น.    หัวข้อที่ 8: ปฏิบัติการ Aggregate ข้อมูล ด้วย Aggregation Designer และ Schema 
Workbench
                                     วิเคราะห์ OLAP Cube โดยใช้ Analysis Report ของ Pentaho EE
                                     โดย ผศ.ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
15:00     –     15:20 น.    หยุดพักรับประทานอาหารว่าง
15:20     –     16:30 น.    หัวข้อที่ 9: ปฏิบัติการสร้าง Business View ด้วย Metadata Editor

                                     และทดสอบการใช้งานกับ Interactive Report ของ Pentaho EE
                                     โดย ผศ.ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ
16:30     –     17:00 น.    แจกประกาศนียบัตร

                                     สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
                                     โดย ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์ และคณะ

 

หลักสูตร 2: Data Analytics with Pentaho BI, Weka, R, and Hadoop: 
From Business Intelligence to Data Science
ณ ห้อง Orchid 4 ชั้น 11 โรงแรม Jasmine Executive Suites  สุขุมวิท 23 กรุงเทพฯ

วันพฤหัสบดีที่  22  ธันวาคม  2559  
08:00
     –     08:45 น.    ลงทะเบียน สำหรับหลักสูตร 2
08.30
     –     09.00 น.    ติดตั้ง PentahoEE 
                                     (สำหรับผู้ที่ไม่ได้อบรมหลักสูตร 1 ในรอบนี้)
09:00
     –     10.10 น.    หัวข้อที่ 1: โจทย์สำหรับทำ BI
                                     “การทำเหมืองข้อมูลของระบบการจัดการเรียนออนไลน์: กรณีศึกษาของระบบ ATutor” ที่ http://ejournals.swu.ac.th/index.php/ssj/article/viewFile/847/846
                                     - ออกแบบ Data model สำหรับการวิเคราะห์
                                     - นำข้อมูล ATutor_wh (ที่ ETL แล้ว) เข้าฐานข้อมูล PostgreSQL 
                                     - ทดสอบ ATutor Pentaho Solutions: Report, Cube, Dashboard
10:10
     –     10:30 น.    รับประทานอาหารว่าง 
10:30
     –     12.00 น.     หัวข้อที่ 2: ภาพรวมของ แนวคิดและหลักการของการวิเคราะห์ข้อมูล: วิธีการทางสถิติ (statistical methods), วิธีการทำเหมืองข้อมูล (data mining), Business Intelligence and Data Science
                                     - ปฏิบัติการการวิเคราะห์ Descriptive Statistics (OLAP Cube) การหาความสัมพันธ์ของ attributes และการสร้าง Regression model ด้วยโปรแกรม R
12:00
     –     13.00 น.    รับประทานอาหารกลางวัน
14:00
     –     15.00 น.    หัวข้อที่ 3: การทำเหมืองข้อมูลด้วย Weka:
                                     Classification, Prediction, Association, Clustering 
                                     โดยใช้ Explorer และ Experimenter Interface  
15:00
     –     15:20 น.     รับประทานอาหารว่าง
15:20
     –     17.00 น.     หัวข้อที่ 4: การวิเคราะห์ข้อมูลของโจทย์สำหรับทำ BI “การทำเหมืองข้อมูล ATutor”                                      โจทย์ประเภท Clustering โดยใช้ Knowledge Flow Interface และการนำโมเดล Weka เข้า Pentaho Data Integration (ETL)

วันศุกร์ที่ ที่  23  ธันวาคม  2559  
09:30
     –     10.10 น.     หัวข้อที่ 5: แนวคิดและหลักการของการวิเคราะห์ big data ด้วย Hadoop และ
                                     Pentaho-Hadoop (Pentaho Data Science Pack)
10:10
     –     10:30 น.     รับประทานอาหารว่าง
10:30
     –     12.00 น.     หัวข้อที่ 6: วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop 
12:00
     –     13.00 น.     รับประทานอาหารกลางวัน
13:00
     –     14:00 น.     การบรรยาย หัวข้อพิเศษ: Internet Of Things (IOT): Architecture & Protocals
                                     โดย รองศาสตราจารย์ ดร.พีรพล ศิริพงศ์วุฒิกร 
                                     คณะวิศวกรรมคอมพิวเตอร์ และ Big Data Experience Center 
                                     
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี
14:00
     –     15.00 น.     หัวข้อที่ 7: การใช้งาน Hive, Hbase
15:00
     –     15:20 น.     รับประทานอาหารว่าง
15:20
     –     17.00 น.     หัวข้อที่ 8: การสร้าง Transformation ของการวิเคราะห์ Web log ด้วย Pentaho-Hadoop 

วันเสาร์ที่  24  ธันวาคม  2559  
09:30
     –     10.10 น.     หัวข้อที่ 9: การติดตั้ง Hadoop Cluster ด้วย Cloudera และทดสอบการใช้งาน
10:10
     –     10:30 น.     รับประทานอาหารว่าง
10:30
     –     12.00 น.     หัวข้อที่ 10: การ run WordCount ด้วย Java Map-Reduce, Pig
12:00
     –     13.00 น.     รับประทานอาหารกลางวัน
13:00
     –     14:00 น.     การบรรยายและสาธิต หัวข้อพิเศษ: 
                                     Lessons Learned from Building Big Data Analytics for Healthcare
                                     โดย ดร.กุลวดี  ศรีพานิชกุลชัย 
                                     หัวหน้าห้องปฏิบัติการวิจัยระบบและข้อมูลสุขภาพ 
                                     
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ หรือ NECTEC
14:00
     –     15.00 น.     หัวข้อที่ 11: การใช้ Flume เก็บข้อมูล weblog ลง Hadoop และ
                                     วิเคราะห์ข้อมูลตัวอย่าง Web log ด้วย Pentaho-Hadoop บน Cloudera Hadoop Cluster
15:00
     –     15:20 น.     รับประทานอาหารว่าง
15:20
     –     16.30 น.     หัวข้อที่ 12: การติดตั้งและใช้งานเครื่องมืออื่น ๆ ของ Hadoop Ecosystem 
16:30
     –     17:00 น.     แจกประกาศนียบัตร
                                     สรุปการอบรม และ ตอบคำถามผู้เข้าอบรม
                                     คณะวิทยากร: ผู้ช่วยศาสตราจารย์ ดร.สุณี  รักษาเกียรติศักดิ์, ผู้ช่วยศาสตราจารย์                                            ดร.วราภรณ์ วิยานนท์, คุณกิตติรักษ์ ม่วงมิ่งสุข
                                     (ดูประวัติและประสบการณ์ของวิทยากรได้ที่เว็บสมาคมฯ www.tatsc.or.th)