पाठान्तर नियमावली
त्रिस्तरीय पाठान्तर
हमारा प्रभेद सॉफ़्टवेयर किसी भी रचना के अलग अलग पाठरूपों/संस्करणों को तीन-तीन स्तरों में मिलाता है – अंशों (sections) एवं उपांशों (segments) का स्थूल पाठान्तर (‘gross’ or macro-collation) किया जाता है, और शब्दों का सूक्ष्म पाठांतर (‘fine’ or micro-collation) किया जाता है।- अंश – उपन्यासों एवं लम्बे गद्यों के अध्याय, नाटकों के अंक एवं दृश्य, और लम्बी कवितावों के सर्ग, यह रचनावों के अंश माने गये हैं। अंश-स्तर में प्रेभेद अलग अलग पाठरूपों/संस्करणों को मिलाकर उनकी समानता एवं भिन्नता दिखाता है। छोटी-कवितावों, छोटे गीतों एवं छोटे निबंधों का एक ही अंश है – ऐसा माना गया है।
टिप्पणी – जिस तरीके से किसी लम्बी रचना का विभाजन किया जाता है, उसके कारण कभी कभी अध्याय, दृश्य इत्यादि के जिन अनुभागों को बीच एक लायिन अंतराल रखा गया है (जैसे कि किसी गद्यरचना में उपस्थित कविता के पद्यों के बीच), उन अनुभागों को प्रभेद के चलन में अलग अलग भागों या अंशों जैसे दिखाया जा सकता है।
- उपांश – गद्यों के अनुच्छेद, नाटक-संलापों की अलग अलग उक्तियाँ, कवितावों के पद्य, यह रचनावों के उपांश माने गये हैं। उपांश स्तर में प्रेभेद अलग पाठरूपों के बराबर उपांशों को मिलाकर उनकी समानता एवं भिन्नता दिखाता है। समान उपांशों को अक्सर समान अंशों में ही पाया जाता है। लेकिन अन्य अंशों मे उपस्थित समान उपांशों को भी अंकित किया जाता है।
जिस कविता या गीत में कोई भी पद्य विभाजन नहीं है, उस कविता या गीत को एक ही उपांश के रूप में प्रस्तुत किया गया है, यानी उसके अंश और उपांश को एक ही माना गया है।
- शब्द – इस सबसे सूक्ष्म स्तर में, प्रभेद बराबर उपांशों के शब्दों को मिलाकर, उन शब्दों की समानता एवं भिन्नता दिखाता है।
प्रभेद कार्य - प्रणाली
(टिप्पणी - सोफ्टवेयर की खातिर इस भाग में सब शीर्षक, प्रतिफल (results या output) इत्यादि को रोमन लिपि में लिखना पड़ा। )- मुख पृष्ठ के पिटारे पर उपस्थित ‘पाठान्तर’ पर क्लिक करें। एक कृतिसूची-जैसी तालिका खुलेगी।
- बाईं तरफ शीर्षक कोष्ठिका में पाठान्तर चिह्न पर क्लिक करें। अब उस रचना का अंश-स्तरीय पाठान्तर पन्ना खुलेगा।
अंश स्तरीय पाठान्तर
- अंश स्तरीय पाठान्तर में रंगीन आड़ी पट्टियाँ दिखायी देंगी। चयनित रचना के हर पाठरूप के लिये (चाहे पाण्डुलिपि पाठरूप हो या मुद्रित संस्करण हो) एक अलग रंग की पट्टी होगी। हर पट्टी को भाग किया गया है जो उसके संबंधित पाठरूप के अंशों को (अध्याय, अंक इत्यादि) दरसाता है। प्रत्येक रंगीन खंड को छायांकित (हल्के रंग से गहरे रंग तक) भी किया गया है ताकि इनको आसानी से देखा जा सका। पाठ की तुलना में अंश की जितनी लम्बाई हो, उसके अनुपात पट्टियों के खंड की चौराई ज्यादा या कम होती है।
छोटी कवितावॉं, छोटे गीतों एवं छोटे निबंधों का एक ही अंश होने के कारण, उनकी पट्टियों में छायांकित विभाजन नहीं हैं। पट्टियों के खंड शून्य से शुरु होकर क्रमांकित भी है, जैसे कि 1316/0 का मतलब हुवा उद्दिष्ट रचना के 1316 बं सं वाले संस्करण का प्राथमिक अंश; 1316/1 का मतलब हुवा 1316 संस्करण का द्वितीय अंश इत्यादि। - प्रस्तुत किसी भी पाठरूप को तुलना का आधार बनाया जा सकता है। यह करने के लिये, इच्छित पाठरूप की पट्टी पर माउस ले जायें; वह पट्टी का रंग और गहरा हो जायेगा।
- अब पट्टी के जिस खंड की तुलना करना चाहते हैं, उस खंड को चयनित करें। अंश का क्रमांक दाहिने ओर उपर के कोने में दिखेगा। अन्य पाठरूपों मे समान अंशों को लाल रंग से रेखांकित किया जायेगा।
- नीचे एक तख्ता प्रकट होगा जिसमें बुनियादी पाठरूप-अंश की तुलना में हर संबंधित अंश की समानता को प्रतिशत के हिसाब में दिखाया जायेगा। हर अंश-क्रमांक के पास एक छोटी पाठ-कड़ी चिह्नित रहेगी। इस पर क्लिक करने से एक छोटा पन्ना खुलेगा जिसमें चयनित अंश का पाठ दिया जायेगा।
- नीचे तख्ते के सबसे बाईं वाली कोष्ठिका में बुनियादी-अंश की संख्या पर क्लिक करने से उस बुनियादी अंश को आधार बनाकर उपांश पाठान्तर पन्ना खुलता है।
नीचे तख्ते में किसी अन्य पाठ पर क्लिक करने से, दाईं तरफ एक रंगीन खड़ा तख्ता प्रकट होगा जिसमें बुनियादी पाठ के उपांशों और इस दूसरे चयनित पाठ के उपांशों को मिलाकर दिखाया जायेगा। जो उपांश मिलते हो, उनको भूरे रंग की डोरी से जोड़ा जयेगा।
उपांश स्तरीय पाठान्तर
- उपांश स्तरीय पाठान्तर अंश स्तरीय पाठान्तर के जैसे ही काम करता है।
- उपांश स्तरीय पाठान्तर खोलने के लिये उपर्युक्त ५वे नम्बर के अनुदेश का पालन करें। पूर्वचयनित पाठरूप के चयनित अंश के लिये एक रंगीन पट्टी दिखायी देगी। इस पट्टी पर क्लिक करने से कुछ और रंगीन पट्टियाँ प्रकट होंगी जिनमें प्रत्येक पट्टी एक अन्य पाठरूप के संबंधित अंश को दरसायेगी। हर पट्टी को भाग किया गया है, और पट्टियों के यह अलग अलग खंड संबंधित अंश के उपांशों (जैसे कि अनुच्छेद, उक्ति, पद्य इत्यादि) को दरसाता है।
- अब अंश की तुलना में उपांश की जितनी लम्बाई हो, उसके अनुपात खंड की चौराई ज्यादा या कम होती है।
छोटी कवितावॉं, छोटे गीतों एवं छोटे निबंधों का एक ही उपांश होने के कारण, उनकी पट्टियों में विभाजन (खंड) नहीं होंगे।
पट्टियों के खंड शून्य से शुरु होकर क्रमांकित भी है, जैसे कि 1316/0/0 का मतलब हुवा उद्दिष्ट रचना के 1316 बं सं वाले संस्करण (पाठरूप) के प्राथमिक अंश का प्राथमिक उपांश; 1316/1/0 का मतलब हुवा 1316 संस्करण के द्वितीय अंश का प्राथमिक उपांश; 1316/1/1 का मतलब हुवा 1316 संस्करण के द्वितीय अंश का द्वितीय उपांश।
- पूर्वचयनित पाठ के जिस उपांश को आप अन्य पाठों के उपांशों से मिलाना चाहते हैं, उसको चुनने के लिये सबसे ऊपर वाली पट्टी में उसके प्रतिनिधिक खंड पर क्लिक करें। बाकि सब पाठरूपों की पट्टियों में समान उपांशों के प्रतिनिधिक खंड लाल रंग से रेखांकित किये जायेंगे। उपांश का क्रमांक दाहिने ओर उपर के कोने में दिखेगा।
- नीचे एक तख्ता प्रकट होगा जिसमें बुनियादी पाठरूप-उपांश की तुलना में हर संबंधित उपांश की समानता को प्रतिशत के हिसाब में दिखाया जायेगा। हर उपांश-क्रमांक के पास एक छोटी पाठ-कड़ी चिह्नित रहेगी। इस पर क्लिक करने से एक छोटा पन्ना खुलेगा जिसमें चयनित उपांश का पाठ दिया जायेगा।
- उपर दाहिने कोने में दिये गये वाममुखी एवं दक्षिणमुखी तीरों के सहारे, किसी भी पट्टी के अलग अलग खंडों तक पहुँचें, खासकर वे खंड जो इतने पतले हो कि उनका माउस से चयन करना कठिन हो।
- उपर दाहिने तरफ़ Grid View डिब्बे पर क्लिक करने से उपांश स्तरीय पाठान्तर के प्रतिफल को तालिका (grid) के रूप में देखा जा सकता है। यहाँ सबसे बाँयें वाले स्तंभ में उद्दिष्ट पाठरूप के उस अंश के अन्यान्य उपांशों की क्रम-संख्या दी गयी है। बाकि के स्तंभों में अन्य पाठरूपों के समान उपांशों की समानता को प्रतिशत के हिसाब में दिया गया है। इसके पहले वाले पन्ने में नीचे तख्ते में पाठरूपों के स्थानों के अनुसार, उनके इन संबंधित स्तंभों को 1, 2, 3 इत्यादि करके क्रमांकित किया गया है।
- नीचे तख्ते के सबसे बाईं वाली कोष्ठिका में बुनियादी-उपांश की संख्या पर क्लिक करने से उस बुनियादी उपांश को आधार बनाकर शब्द स्तरीय सूक्ष्म पाठान्तर (fine collation) पन्ना खुलता है।
शब्द स्तरीय (सूक्ष्म) पाठान्तर
- शब्द स्तरीय सूक्ष्म पाठान्तर के प्रतिफल एक पन्ने पर चार विभागों में दिखाया जाता है। बुनियादी पाठ का नाम (अंश और उपांश संख्या के साथ) उपर शीर्षक-जैसा लिखा जाता है। अन्य पाठरूपों को (संबिधित अंश और उपांश संख्या के साथ) चार विभागों के बाहर बाँयें स्तंभ में सूचीबद्ध किया गया है।
- उपर बाँयें वाले डिब्बे में बुनियादी पाठ-उपांश का पाठ दिया जायेगा।
- नीचे बाँयें वाले डिब्बे में अन्य किसी एक पाठरूप का उपांश-पाठ दिया जायेगा। आप जिस पाठरूप का संबंधित उपांश-पाठ देखना चाहते हैं, उस पाठरूप को आप बाँयें वाले सूची में से चुनें।
- उपर दाहिने वाले डिब्बे में बुनियादी उपांश-पाठ फिर दिया जायेगा। अंतर यह कि इस डिब्बे में पाठ को अलग अलग रंगों से रंगाकित किया जायेगा ताकि इस पाठरूप के और अन्य पाठरूपों का मेल आसानी से दिख सके।
- काला रंग का मतलब हुआ कि वह शब्द बाकि सब पाठरूपों में बिलकुल एक-समान है
- लाल रंग का मतलब हुआ कि कम से कम एक अन्य पाठरूप में वह शब्द सिर्फ लगभग समान है। शब्द पर क्लिक करने से इस शब्द के दूसरे रूपों को नीचे दाहिने वाले डिब्बे में दिखाया जायेगा।
- नील रंग का मतलब हुआ कि शब्द बुनियादी उपांश-पाठ में मौजूद है, पर कम से कम एक अन्य पाठरूप में अनुपस्थित है। शब्द पर क्लिक करने से नीचे दाहिने वाले डिब्बे में एक उचित संख्या के पास एक बिन्दु दिखेगा। इससे जाना जायेगा कि कौन से पाठरूप में शब्द अनुपस्थित है।
- हरा रंग का मतलब हुआ कि शब्द बुनियादी उपांश-पाठ में अनुपस्थित है पर कम से कम एक अन्य पाठरूप में मौजूद है। हरे बिन्दु पर क्लिक करने से नीचे दाहिने वाले डिब्बे में शब्द दिखाया जायेगा। किन पाठरूपों में यह शब्द उपस्थित है, यह भी नीचे दाहिने वाले डिब्बे से जाना जा सकता है।
बिन्दु का मतलब हुआ कि चयनित पाठ में शब्द अनुपस्थित है जो कम से कम एक अन्य पाठरूप में बिलकुल वहीं स्थान में वर्तमान है।
पाठरूपों एवं संस्करणों के नाम
पाठरूप एवं संस्करण को निम्नलिखित तरीकों से नामांकित किया गया है –- मुद्रित लेखों के विषय में : बँगला कृति के लिये बं सं के अनुसार प्रकाशन-वर्ष के चार अंक; अँग्रेज़ी कृति के लिये, अंतरराष्ट्रीय वर्षांक के अनुसार प्रकाशन-वर्ष के चार अंक।
अगर एक ही साल में एक से अधिक पाठरूप प्रकाशित हुए हो, तो उन्हें रोमन अक्षरों के क्रम (a, b, c इत्यादि) से पहचाना गया है। - पाण्डुलिपियों के विषय में :
रवीन्द्रभवन में मूल पाण्डुलिपि-क्रमांक के अनुसार [R+पाण्डुलिपि संख्या] ;
रवीन्द्रभवन में ‘बँगला पाण्डुलिपि फायिलें’ (Bengali Manuscript Files) क्रमांक के अनुसार [B+पाण्डुलिपि संख्या] ;
रवीन्द्रभवन में ‘अंग्रेज़ी पाण्डुलिपि फायिलें’ (English Manuscript Files) क्रमांक के अनुसार [E+पाण्डुलिपि संख्या] ;
और हार्वर्ड विश्वविद्यालय की पाण्डुलिपि होने पर [H+पाण्डुलिपि संख्या]।
मेल प्रतिशत विधि
शब्द मेल
१-४ वर्णों के शब्दों को बिलकुल एक समान माना जायेगा अगर हर अक्षर मिलता हो। जो शब्दों में चार से अधिक वर्ण हो, उन शब्दों के विषय में, अतिरिक्त हर चार वर्णों के लिये एक वर्ण का अंतर स्वीकारा जायेगा : अर्थात् ५-८ वर्ण वाले शब्दों में अगर केवल एक वर्ण असमान हो, तब भी उन शब्दों को एक समान माना जायेगा; तथा ९-१२ वर्ण वाले शब्दों में अगर दो वर्णों तक की असमानता हो, तब भी उन शब्दों को एक समान ही माना जायेगा, इत्यादि।
टिप्पणी :
१. वर्णों में अ-कार (অ-কার) के अलावा स्वरों को भी गिना जायेगा। युक्ताक्षरों के हर व्यंजन को एवं हर स्वर को अलग वर्ण माना जायेगा। तथा, কাল के ३ वर्ण, বর্ষা के ४ वर्ण , নম্রতা के ५ वर्ण, और রবীন্দ্র্নাথ के ९ वर्ण हैं।
२. विरामादि चिह्नों को वर्णों में नहीं गिना जायेगा। तथा योजक चिह्न (hyphen) को, उत्संबोधन चिह्न (apostrophe) को, और उद्धरण चिह्न (quotation marks) को भी वर्णों में नहीं गिना जायेगा।
अंशों एवं उपांशों में मेल - प्रतिशत
- अंशों एवं उपांशों के विषय में, आम तौर पर बुनियादी पाठ और तुल्य पाठ में दोनों तरफ़ से ६०% (या अधिक) मेल होने पर उन्हें समान पाठ माना जायेगा।
- यदि कोई पाठ में एक लम्बे अंश या उपांश को दो या अधिक भागों में बाँटा गया हो, तब उपर्युक्त हिसाब उनके लिये नहीं बैठेगा। हिसाब मिलाने के लिये, किसी दो पाठों में जब एक ही तरफ़ से ६०% (या अधिक) का मेल हो, तब दूसरी तरफ से मामूली तौर पर १५% का tension count दिया जायेगा। जहाँ tension count १५% से अधिक होगा, वहाँ उन दो अंशों/उपांशों को समान माना जायेगा।
- लेकिन इस दूसरे हिसाब के कारण कुछ असमान पाठों को भी समान दिखाया जा सकता है, खासकर जहाँ पाठों में १५% का आकस्मिक मेल यादृच्छिक शब्दों के कारण हो जाता है। ऐसा होने की संभावना बढ़ती है जहाँ उपांश बहुत ही छोटे हो (जैसे कि एक या कुछ ही शब्दों के उपांशों में)।
पाठकों को चेतावनी दी जाती है कि बहुत छोटे मेल प्रतिशत (३०-३५% से कम) को वास्तविक पाठ देखे बिना नहीं स्वीकारे। विशेषकर तब इसे नहीं स्वीकारे, जब अन्य संबंधित पाठों के साथ उस ही पाठ का ६०% (या अधिक) का मेल दिखाया जा रहा हो।
- कुछ पाठों में एक ही शब्द या वाक्यांश बार बार मिलते हैं – जैसे कि नाटकों के नाट्य-निर्देश या वृन्दगानों की स्थायी पंक्तियाँ इत्यादि। इसका एक परिणाम यह है कि असमान यादृच्छिक अंशों/उपांशों में बहुत अधिक मेल प्रतिशत (८०-८५%+, कई बार पूरे १००%) बार बार दिखाया जा सकता है। इस समस्या का समाधान हमने ऐसे किया है - बारबार अगर अन्य अंशों/उपांशों का और किसी एक ही अंश/उपांश का मेल प्रतिशत बहुत अधिक (८५% +) हो, तब केवल प्राथमिक मेल को ही पाठान्तर प्रक्रिया में स्वीकारा जायेगा।