ธัชชัย วงศ์กิจรุ่งเรือง
tuchchai@hotmail.com

iarchive01

ข้อมูลบนโลกอินเทอร์เน็ตมีมากมายมหาศาลเพียงใดดูได้จากสถิติใน Worldwidewebsize.com ที่ประเมินว่าปัจจุบัน เฉพาะจำนวนหน้าเว็บไซต์นั้นก็มีถึง ๒๖,๐๐๐ ล้านหน้าเลยทีเดียว (แน่นอนหลังจากคุณได้อ่านบทความนี้ หน้าเอกสารบนเว็บไซต์ยังเพิ่มขึ้นเรื่อย ๆ ทุกวัน) ที่น่าสนใจคือข้อมูลส่วนใหญ่นั้นเป็นหน้าเว็บเพจที่เรียกว่า Invisible Web หรือหน้าเอกสารบนเว็บไซต์ที่ตัวค้นข้อมูลบนอินเทอร์เน็ตหาไม่เจอ

เพราะข้อมูลที่มีลักษณะเป็นดิจิทัลไม่ได้ปรากฏเป็นวัตถุเด่นชัดเช่นเดียวกับสื่อในอดีต นักท่องโลกเสมือนหลายท่านคงเคยสงสัยว่ามีหน่วยงานใดหรือไม่ ที่ทำหน้าที่เก็บข้อมูลตั้งแต่แรกเริ่มของเว็บไซต์ต่าง ๆ บนโลกอินเทอร์เน็ต เพื่อแสดงให้เห็นถึงเว็บไซต์รูปแบบเริ่มแรกถึงปัจจุบันโดยไม่ต้องห่วงว่ามันจะสูญหายไปตามกาลเวลา เสมือนหอจดหมายเหตุที่ทำหน้าที่บันทึกประวัติศาสตร์ของอินเทอร์เน็ต

คำตอบคือมีและอาจจะไปไกลกว่าที่หลายคนคิด นั่นคือ Internet Archive หรือ IA (archive.org) เป็นองค์กรไม่แสวงผลกำไร มีสำนักงานในเพรสซิดิโอ เขตทหารของเมืองซานฟรานซิสโก สหรัฐอเมริกา เว็บไซต์นี้สร้างขึ้นในปี ค.ศ. ๑๙๙๖ ทำหน้าที่เป็นห้องสมุดดิจิทัลบนอินเทอร์เน็ต ใช้เครื่องมือสืบค้นและคอยเก็บสำเนาข้อมูลหน้าเว็บไซต์ที่มีอายุเฉลี่ย ๑๐๐ วันขึ้นไปไว้สำหรับนักวิจัย นักประวัติศาสตร์ และผู้รักการค้นคว้า โดยคงมีอยู่บนอินเทอร์เน็ตอย่างถาวร ไม่สูญหายไปตามกาลเวลา การเก็บสำเนาทำในลักษณะเดียวกับจดหมายเหตุ ซึ่งข้อมูลส่วนใหญ่ได้รับการบริจาคจากเว็บไซต์ Alexa คนทั่วไปก็สามารถ นำข้อมูลจากเว็บไซต์ต่างๆ ไปเก็บไว้ที่นี่ได้เช่นกันด้วยการสมัครเป็นสมาชิก

หน้าเก่าของเว็บไซต์ต่าง ๆ ย้อนกลับไป ๖-๑๒ เดือนสามารถค้นหาได้จากเครื่องมือที่เรียกว่า Wayback Machine ตั้งแต่ผู้ใช้เข้าไปยังหน้าแรก เพียงแค่พิมพ์ URL เว็บไซต์ที่ต้องการและกดปุ่ม Take Me Back คุณก็สามารถเห็นลำดับการปรับปรุงของเว็บไซต์นั้น ๆ และเข้าชมได้ โดยอาจรวมถึงเว็บไซต์เก่า ๆ ที่ปิดตัวไปแล้วแต่ยังไม่ได้ลบฐานข้อมูลออกไป และยังมีข้อมูลที่เป็นประโยชน์อยู่ ซึ่งหากเจ้าของเว็บใดไม่ต้องการให้ข้อมูลใดปรากฏในเครื่องมือนี้ก็สามารถทำได้เช่นกัน

และนับตั้งแต่ปี ๑๙๙๙ ที่นี่ก็ยังได้ทำการแปลงข้อมูลในอดีตจากห้องสมุดรัฐสภาอเมริกันและสถาบัน สมิทโซเนียนให้กลายเป็นสื่อในรูปแบบดิจิทัลเพื่อป้องกันการสูญหายที่รอวันเกิดขึ้นในอนาคต ทั้งภาพ เสียง สื่อภาพเคลื่อนไหว เอกสาร-ตำราเรียน และซอฟต์แวร์ โดยได้รับการสนับสนุนในการแปลงข้อมูล จากสมาคม Open Content Alliance รวมไปถึงยังส่งสำเนาข้อมูลอีกชุดไปเก็บยังหอสมุดอเล็กซานเดรีย ณ ประเทศอียิปต์อีกทอดหนึ่ง ส่วนใครที่อยากร่วมเก็บข้อมูลในรูปแบบดิจิทัลด้วยก็สามารถเข้าไปเก็บไว้ได้ในเว็บไซต์ Archive-it.org

iarchive02

เว็บไซต์ Archive-it.org

iarchive03

บรูว์สเตอร์ เคล ผู้ก่อตั้ง

ประธานผู้ก่อตั้งเว็บไซต์นี้คือ บรูว์สเตอร์ เคล (Brewster Kahle) อดีตผู้บุกเบิกธุรกิจด้านอินเทอร์เน็ตชาวอเมริกัน โดยเฉพาะ WAIS โปรแกรมสืบค้นข้อมูลยุคแรก และเว็บไซต์ Alexa ผู้ประมวลผลสถิติทางเว็บไซต์รายใหญ่ เขาใช้เงินที่ได้จากการขายธุรกิจทั้งสองแก่บริษัท AOL และ Amazon ตามลำดับมาก่อตั้งองค์กรแห่งนี้เพื่อประโยชน์สาธารณะ

เคลซึ่งกลายเป็นผู้บุกเบิกการเก็บข้อมูลบนโลกอินเทอร์เน็ตเผยว่า เขามีความคิดถึงจักรวาลแห่งองค์ ความรู้มาตั้งแต่สมัยเรียน หรือเมื่อ ๒๐ ปีมาแล้ว และ มีเป้าหมายจะเก็บสื่อทุกชนิดตั้งแต่มนุษย์เริ่มทำการบันทึกกันในยุคสุเมเรียนเลยทีเดียว เขาเชื่อว่าองค์กรนี้จะเป็นทางออกสำคัญให้แก่ห้องสมุดในอนาคต เพราะปัจจุบันค่าใช้จ่ายของห้องสมุดทั่วสหรัฐอเมริกา ที่สูงถึง ๒๔,๐๐๐ ล้านเหรียญต่อปี เสียไปกับงานด้านการพิมพ์ถึง ๓๐ % ขณะเดียวกันห้องสมุดของเขายังสามารถใช้ได้ผ่านอินเทอร์เน็ตทั่วโลก

“หากเราสามารถสร้างห้องสมุดด้วยวิสัยทัศน์ของกรีกได้อีกครั้งด้วยเทคโนโลยียุคสมัยใหม่ มันย่อมเป็นเรื่องน่าภูมิใจนะ” เคลกล่าวในการสัมภาษณ์เมื่อปี ๒๐๐๖

ความมุ่งมั่นของเคลยังก่อให้เกิดอีกหลายโครงการ หนึ่งในนั้นคือการต่อยอดเป็น Internet Archive Bookmobile หรือร้านหนังสือเคลื่อนที่ ซึ่งให้บริการผู้ซื้อค้นข้อมูลที่ต้องการจากเว็บไซต์นี้ เพื่อพิมพ์หนังสือตามสั่งในราคาเพียง ๑ เหรียญเท่านั้น

การแปลงข้อมูลดิจิทัลอาจไม่ได้เป็นปัญหามากนักกับผู้ผลิตหนังสือ ขึ้นอยู่กับการปรับตัวของผู้ผลิตที่สามารถทำให้หนังสืออิเล็กทรอนิกส์และหนังสือเล่มต่างเกื้อหนุนกันในเชิงธุรกิจ แต่กระนั้น Internet Archive ก็ยังต้องถูกตั้งคำถามหลายประเด็น โดยเฉพาะปัญหาการละเมิดลิขสิทธิ์และการเก็บเนื้อหา
ที่มีลักษณะหมิ่นประมาท ดังกรณีที่ต้องถอดหน้าเว็บไซต์ที่มีข้อความวิพากษ์ลัทธิ Scientology หลังจากถูกทนายของลัทธิดังกล่าวยื่นฟ้อง รวมถึงการที่หลายประเทศในยุโรปถือว่าเว็บไซต์นี้เป็นการผลิตข้อมูลซ้ำและไม่อนุญาตให้ทางเว็บไซต์เก็บข้อมูล

ในทางตรงกันข้าม ก็มีผู้ใช้อีกกลุ่มหนึ่งไม่พอใจที่เครื่องมือสืบค้นอย่าง Wayback Machine ไม่สามารถค้นหรือเก็บข้อมูลเว็บไซต์ต่าง ๆ ได้ครบถ้วนจริง อันเนื่องจากปัญหาทางกฎหมายในปัจจุบัน

ส่วนผู้ท้าชิงที่น่าจะส่งผลกระทบต่อ Internet Archive คงหนีไม่พ้นโครงการห้องสมุดดิจิทัลโลก หรือ World Digital Library ซึ่งเพิ่งก่อตั้งเมื่อปี ๒๐๐๕ ผ่านการผลักดันโดยห้องสมุดรัฐสภาอเมริกัน ห้องสมุดที่ใหญ่ที่สุดในโลกในปัจจุบัน โดยได้รับการสนับสนุนทั้งจากเว็บไซต์กูเกิลและองค์การสหประชาชาติ รวมไปถึงคู่แข่งปัจจุบัน นั่นคือโครงการจัดเก็บเอกสารในรูปแบบดิจิทัลจากหลายองค์กรที่เริ่มตื่นตัวกับศักยภาพของสื่อชนิดนี้ ซึ่งหลายฝ่ายรวมไปถึงโครงการของบริษัทยักษ์ใหญ่อย่าง Google, Yahoo และ Amazon ที่ดำเนินการร่วมกันกับ Internet Archive ในลักษณะพันธมิตรทางธุรกิจก็พลิกสถานการณ์กลายเป็นคู่แข่งได้เหมือนกัน ดังเช่น Amazon เปิดเว็บไซต์ค้นข้อมูลหนังสือ A9.com หรือ Google มีโครงการ Google Book Search

พ้นจากอุปสรรคดังกล่าวแล้ว เป้าหมายอันใหญ่ยิ่งในการเก็บประวัติศาสตร์ของมนุษยชาติสู่รูปแบบดิจิทัลของ บรูว์สเตอร์ เคล ด้วยระยะเวลาเพียง ๑๐ กว่าปีมานี้ของ Internet Archive ยังนับเป็นเพียงจุดเริ่มต้นที่เล็กเกินจะพิสูจน์ความมั่นคงใดในอนาคต เราคงต้องยอมรับ…นี่เป็นงานที่ไม่มีวันทำได้สำเร็จ ตราบใดที่โลกอินเทอร์เน็ตไม่ล่มสลายไปเสียก่อน หน้าเว็บไซต์จำนวนมหาศาลก็เพิ่มขึ้นทุกวัน ๆ และองค์กรแห่งนี้ก็ต้องหาเงินทุนและวิธีจัดเก็บมากขึ้นเป็นเงาตามตัว เฉพาะการสแกนหนังสือ ๑ เล่มนั้นก็มีค่าใช้จ่ายตั้งแต่ ๕-๓๐ เหรียญสหรัฐแล้ว

และนั่นคงเป็นบททดสอบที่สำคัญยิ่งกว่าเสียอีก