" /> Internet Archive คลังข้อมูลยุคดิจิทัล - สารคดี.คอม [ Sarakadee Magazine ]

Internet Archive คลังข้อมูลยุคดิจิทัล

เมษายน 15, 2009 
1


ธัชชัย วงศ์กิจรุ่งเรือง
tuchchai@hotmail.com

ข้อมูลบนโลกอินเทอร์เน็ตมีมากมายมหาศาลเพียงใดดูได้จากสถิติใน Worldwidewebsize.com ที่ประเมินว่าปัจจุบัน เฉพาะจำนวนหน้าเว็บไซต์นั้นก็มีถึง ๒๖,๐๐๐ ล้านหน้าเลยทีเดียว (แน่นอนหลังจากคุณได้อ่านบทความนี้ หน้าเอกสารบนเว็บไซต์ยังเพิ่มขึ้นเรื่อย ๆ ทุกวัน) ที่น่าสนใจคือข้อมูลส่วนใหญ่นั้นเป็นหน้าเว็บเพจที่เรียกว่า Invisible Web หรือหน้าเอกสารบนเว็บไซต์ที่ตัวค้นข้อมูลบนอินเทอร์เน็ตหาไม่เจอ

เพราะข้อมูลที่มีลักษณะเป็นดิจิทัลไม่ได้ปรากฏเป็นวัตถุเด่นชัดเช่นเดียวกับสื่อในอดีต นักท่องโลกเสมือนหลายท่านคงเคยสงสัยว่ามีหน่วยงานใดหรือไม่ ที่ทำหน้าที่เก็บข้อมูลตั้งแต่แรกเริ่มของเว็บไซต์ต่าง ๆ บนโลกอินเทอร์เน็ต เพื่อแสดงให้เห็นถึงเว็บไซต์รูปแบบเริ่มแรกถึงปัจจุบันโดยไม่ต้องห่วงว่ามันจะสูญหายไปตามกาลเวลา เสมือนหอจดหมายเหตุที่ทำหน้าที่บันทึกประวัติศาสตร์ของอินเทอร์เน็ต

คำตอบคือมีและอาจจะไปไกลกว่าที่หลายคนคิด นั่นคือ Internet Archive หรือ IA (archive.org) เป็นองค์กรไม่แสวงผลกำไร มีสำนักงานในเพรสซิดิโอ เขตทหารของเมืองซานฟรานซิสโก สหรัฐอเมริกา เว็บไซต์นี้สร้างขึ้นในปี ค.ศ. ๑๙๙๖ ทำหน้าที่เป็นห้องสมุดดิจิทัลบนอินเทอร์เน็ต ใช้เครื่องมือสืบค้นและคอยเก็บสำเนาข้อมูลหน้าเว็บไซต์ที่มีอายุเฉลี่ย ๑๐๐ วันขึ้นไปไว้สำหรับนักวิจัย นักประวัติศาสตร์ และผู้รักการค้นคว้า โดยคงมีอยู่บนอินเทอร์เน็ตอย่างถาวร ไม่สูญหายไปตามกาลเวลา การเก็บสำเนาทำในลักษณะเดียวกับจดหมายเหตุ ซึ่งข้อมูลส่วนใหญ่ได้รับการบริจาคจากเว็บไซต์ Alexa คนทั่วไปก็สามารถ นำข้อมูลจากเว็บไซต์ต่างๆ ไปเก็บไว้ที่นี่ได้เช่นกันด้วยการสมัครเป็นสมาชิก

หน้าเก่าของเว็บไซต์ต่าง ๆ ย้อนกลับไป ๖-๑๒ เดือนสามารถค้นหาได้จากเครื่องมือที่เรียกว่า Wayback Machine ตั้งแต่ผู้ใช้เข้าไปยังหน้าแรก เพียงแค่พิมพ์ URL เว็บไซต์ที่ต้องการและกดปุ่ม Take Me Back คุณก็สามารถเห็นลำดับการปรับปรุงของเว็บไซต์นั้น ๆ และเข้าชมได้ โดยอาจรวมถึงเว็บไซต์เก่า ๆ ที่ปิดตัวไปแล้วแต่ยังไม่ได้ลบฐานข้อมูลออกไป และยังมีข้อมูลที่เป็นประโยชน์อยู่ ซึ่งหากเจ้าของเว็บใดไม่ต้องการให้ข้อมูลใดปรากฏในเครื่องมือนี้ก็สามารถทำได้เช่นกัน

และนับตั้งแต่ปี ๑๙๙๙ ที่นี่ก็ยังได้ทำการแปลงข้อมูลในอดีตจากห้องสมุดรัฐสภาอเมริกันและสถาบัน สมิทโซเนียนให้กลายเป็นสื่อในรูปแบบดิจิทัลเพื่อป้องกันการสูญหายที่รอวันเกิดขึ้นในอนาคต ทั้งภาพ เสียง สื่อภาพเคลื่อนไหว เอกสาร-ตำราเรียน และซอฟต์แวร์ โดยได้รับการสนับสนุนในการแปลงข้อมูล จากสมาคม Open Content Alliance รวมไปถึงยังส่งสำเนาข้อมูลอีกชุดไปเก็บยังหอสมุดอเล็กซานเดรีย ณ ประเทศอียิปต์อีกทอดหนึ่ง ส่วนใครที่อยากร่วมเก็บข้อมูลในรูปแบบดิจิทัลด้วยก็สามารถเข้าไปเก็บไว้ได้ในเว็บไซต์ Archive-it.org

เว็บไซต์ Archive-it.org

บรูว์สเตอร์ เคล ผู้ก่อตั้ง

ประธานผู้ก่อตั้งเว็บไซต์นี้คือ บรูว์สเตอร์ เคล (Brewster Kahle) อดีตผู้บุกเบิกธุรกิจด้านอินเทอร์เน็ตชาวอเมริกัน โดยเฉพาะ WAIS โปรแกรมสืบค้นข้อมูลยุคแรก และเว็บไซต์ Alexa ผู้ประมวลผลสถิติทางเว็บไซต์รายใหญ่ เขาใช้เงินที่ได้จากการขายธุรกิจทั้งสองแก่บริษัท AOL และ Amazon ตามลำดับมาก่อตั้งองค์กรแห่งนี้เพื่อประโยชน์สาธารณะ

เคลซึ่งกลายเป็นผู้บุกเบิกการเก็บข้อมูลบนโลกอินเทอร์เน็ตเผยว่า เขามีความคิดถึงจักรวาลแห่งองค์ ความรู้มาตั้งแต่สมัยเรียน หรือเมื่อ ๒๐ ปีมาแล้ว และ มีเป้าหมายจะเก็บสื่อทุกชนิดตั้งแต่มนุษย์เริ่มทำการบันทึกกันในยุคสุเมเรียนเลยทีเดียว เขาเชื่อว่าองค์กรนี้จะเป็นทางออกสำคัญให้แก่ห้องสมุดในอนาคต เพราะปัจจุบันค่าใช้จ่ายของห้องสมุดทั่วสหรัฐอเมริกา ที่สูงถึง ๒๔,๐๐๐ ล้านเหรียญต่อปี เสียไปกับงานด้านการพิมพ์ถึง ๓๐ % ขณะเดียวกันห้องสมุดของเขายังสามารถใช้ได้ผ่านอินเทอร์เน็ตทั่วโลก

“หากเราสามารถสร้างห้องสมุดด้วยวิสัยทัศน์ของกรีกได้อีกครั้งด้วยเทคโนโลยียุคสมัยใหม่ มันย่อมเป็นเรื่องน่าภูมิใจนะ” เคลกล่าวในการสัมภาษณ์เมื่อปี ๒๐๐๖

ความมุ่งมั่นของเคลยังก่อให้เกิดอีกหลายโครงการ หนึ่งในนั้นคือการต่อยอดเป็น Internet Archive Bookmobile หรือร้านหนังสือเคลื่อนที่ ซึ่งให้บริการผู้ซื้อค้นข้อมูลที่ต้องการจากเว็บไซต์นี้ เพื่อพิมพ์หนังสือตามสั่งในราคาเพียง ๑ เหรียญเท่านั้น

การแปลงข้อมูลดิจิทัลอาจไม่ได้เป็นปัญหามากนักกับผู้ผลิตหนังสือ ขึ้นอยู่กับการปรับตัวของผู้ผลิตที่สามารถทำให้หนังสืออิเล็กทรอนิกส์และหนังสือเล่มต่างเกื้อหนุนกันในเชิงธุรกิจ แต่กระนั้น Internet Archive ก็ยังต้องถูกตั้งคำถามหลายประเด็น โดยเฉพาะปัญหาการละเมิดลิขสิทธิ์และการเก็บเนื้อหา
ที่มีลักษณะหมิ่นประมาท ดังกรณีที่ต้องถอดหน้าเว็บไซต์ที่มีข้อความวิพากษ์ลัทธิ Scientology หลังจากถูกทนายของลัทธิดังกล่าวยื่นฟ้อง รวมถึงการที่หลายประเทศในยุโรปถือว่าเว็บไซต์นี้เป็นการผลิตข้อมูลซ้ำและไม่อนุญาตให้ทางเว็บไซต์เก็บข้อมูล

ในทางตรงกันข้าม ก็มีผู้ใช้อีกกลุ่มหนึ่งไม่พอใจที่เครื่องมือสืบค้นอย่าง Wayback Machine ไม่สามารถค้นหรือเก็บข้อมูลเว็บไซต์ต่าง ๆ ได้ครบถ้วนจริง อันเนื่องจากปัญหาทางกฎหมายในปัจจุบัน

ส่วนผู้ท้าชิงที่น่าจะส่งผลกระทบต่อ Internet Archive คงหนีไม่พ้นโครงการห้องสมุดดิจิทัลโลก หรือ World Digital Library ซึ่งเพิ่งก่อตั้งเมื่อปี ๒๐๐๕ ผ่านการผลักดันโดยห้องสมุดรัฐสภาอเมริกัน ห้องสมุดที่ใหญ่ที่สุดในโลกในปัจจุบัน โดยได้รับการสนับสนุนทั้งจากเว็บไซต์กูเกิลและองค์การสหประชาชาติ รวมไปถึงคู่แข่งปัจจุบัน นั่นคือโครงการจัดเก็บเอกสารในรูปแบบดิจิทัลจากหลายองค์กรที่เริ่มตื่นตัวกับศักยภาพของสื่อชนิดนี้ ซึ่งหลายฝ่ายรวมไปถึงโครงการของบริษัทยักษ์ใหญ่อย่าง Google, Yahoo และ Amazon ที่ดำเนินการร่วมกันกับ Internet Archive ในลักษณะพันธมิตรทางธุรกิจก็พลิกสถานการณ์กลายเป็นคู่แข่งได้เหมือนกัน ดังเช่น Amazon เปิดเว็บไซต์ค้นข้อมูลหนังสือ A9.com หรือ Google มีโครงการ Google Book Search

พ้นจากอุปสรรคดังกล่าวแล้ว เป้าหมายอันใหญ่ยิ่งในการเก็บประวัติศาสตร์ของมนุษยชาติสู่รูปแบบดิจิทัลของ บรูว์สเตอร์ เคล ด้วยระยะเวลาเพียง ๑๐ กว่าปีมานี้ของ Internet Archive ยังนับเป็นเพียงจุดเริ่มต้นที่เล็กเกินจะพิสูจน์ความมั่นคงใดในอนาคต เราคงต้องยอมรับ…นี่เป็นงานที่ไม่มีวันทำได้สำเร็จ ตราบใดที่โลกอินเทอร์เน็ตไม่ล่มสลายไปเสียก่อน หน้าเว็บไซต์จำนวนมหาศาลก็เพิ่มขึ้นทุกวัน ๆ และองค์กรแห่งนี้ก็ต้องหาเงินทุนและวิธีจัดเก็บมากขึ้นเป็นเงาตามตัว เฉพาะการสแกนหนังสือ ๑ เล่มนั้นก็มีค่าใช้จ่ายตั้งแต่ ๕-๓๐ เหรียญสหรัฐแล้ว

และนั่นคงเป็นบททดสอบที่สำคัญยิ่งกว่าเสียอีก

เว็บไซต์ Internet World Stats ประมาณว่ามีผู้ใช้อินเทอร์เน็ตกว่า ๒,๔๐๐ ล้านคน ส่วนผลสำรวจของบริษัทวิจัย eMarketer...
แอรอน สวาร์ตซ (Aaron Swartz) นักเขียน นักพัฒนาโปรแกรม และนักกิจกรรมอินเทอร์เน็ตชาวอเมริกันวัยเพียง ๒๖ ปี ตัดสินใจจบชีวิตตนเอง
เมื่อวันที่ ๙ กรกฎาคมที่ผ่านมา สมาคมการตลาดดิจิทัลแห่งเอเชียออกรายงานประจำปี ๒๕๕๕ ระบุว่า


ผู้ดูแล และลงข้อมูลประจำเวบไซต์ sarakadee.com








ใส่ความเห็น

อีเมล์ของคุณจะไม่แสดงให้คนอื่นเห็น ช่องที่ต้องการถูกทำเครื่องหมาย *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

เว็บไซต์ Internet World Stats ประมาณว่ามีผู้ใช้อินเทอร์เน็ตกว่า ๒,๔๐๐ ล้านคน ส่วนผลสำรวจของบริษัทวิจัย eMarketer...
แอรอน สวาร์ตซ (Aaron Swartz) นักเขียน นักพัฒนาโปรแกรม และนักกิจกรรมอินเทอร์เน็ตชาวอเมริกันวัยเพียง ๒๖ ปี ตัดสินใจจบชีวิตตนเอง
เมื่อวันที่ ๙ กรกฎาคมที่ผ่านมา สมาคมการตลาดดิจิทัลแห่งเอเชียออกรายงานประจำปี ๒๕๕๕ ระบุว่า