Tuesday 7 June 2016

XML டாக்குமென்ட்கள் எவ்வாறு வடிவமைக்கப்படுகின்றன?




XML அறிமுகம்.

Extensible Markup Language என்பதன் சுருக்கமே XML என்பதாகும். Extensible என்பதன் அர்த்தம் html போல் அல்லாது நாமே சொந்தமாக டேக்குகளை அமைத்துக் கொள்ளலாம் என்பதாகும்.
XML என்பது எல்லா ப்ளாட்ஃபார்மிலும் (hardware மற்றும் software) செயல் படக்கூடியதாகும்.XML ஆனது நம்மை எல்லாவிதமான கம்ப்யூட்டர்களாலும் இண்டர்பிரட் பண்ணக்கூடிய டேட்டாவை சேமித்து அவற்றை பரிமாறிக்கொள்ள பயன் படுகின்றது.B2B(Business to Business) மின் வர்த்தகத் துறையில் அவர்களுக்கிடையே பொதுவான தக்கமைப்பில் டேட்டாவை பரிமாறிக்கொள்ள பயன்படுகின்றது.

SGML, HTML மற்றும் XML இடையேயான வித்தியாசங்கள்.


XML ஒரு மார்க்அப் மொழி ஆகும். மார்க்அப் மொழிகளில் டேக்குகளானது டேட்டாவானது கணினியில் எவ்வாறு காண்பிக்கப்பட வேண்டும் என்பதை குறிப்பிட பயன்படுகின்றது.மார்க்அப் மொழிகளுக்கு சில உதாரணங்கள் SGML,HTML மற்றும் XML ஆகும்.
SGML மொழியானது பயனர்களை டேக்குகளை விவரிப்பதிலும் அவற்றை வடிவமைப்பதிலும் சொந்த இலக்கணத்தை அமைத்துக்கொள்ள அனுமதிக்கின்றது. எனினும் இந்த மொழியானது சிக்கலானதும் மற்றும் கடினமானதும் ஆகும்.
HTML ஆனது எளிய முறையில் இணையப் பக்கங்களை வடிவமைக்கப்பயன்படுகின்றது. எனினும் இந்த மொழியில் பயனர்கள் சொந்தமாக டேக்குகளை உருவாக்க முடியாது. எல்லா டேக்குகளுமே முன் கூட்டியே அமைக்கப்பட்டவே தான்.
XML என்பது SGML மொழியின் துணைக்குழு(subset) ஆகும்.இது இணையத்தில் டேட்டாவை விவரிக்க மற்றும் பரிமாறிக் கொள்ள W3Cயால்(WORLD WIDE WEB CONSORTIUM) உருவாக்கப் பட்டதாகும்.இது இணையத்தில் டேட்டாவை பரிமாறுவதை எளிமையாக்குகின்றது.

XML-ன் நண்மைகள்

1.   எல்லாவிதமான கணினிகளுக்குமிடையே டேட்டாவை பரிமாறிக்கொள்ள பயன்படுகின்றது.
2.   தேடுதலை எளிமையாக்குகின்றது.
3.   பயன்படுத்தவரால் தேர்த்தெடுக்கப்பட்ட டேட்டாவை தருகின்றது.
4.   நிரலாளர் சொந்தமாக டேக்குகளை உபயோகிக்கலாம்.
5.   டேட்டாவை புதுப்பிக்கும் போது HTML போல் அல்லாது முழுப்பக்கத்தையும் மீண்டும் LOAD செய்யவேண்டிய தேவையில்லை.
சொந்தமாக டேக்குகளை உருவாக்குவது.
HTML மொழியானது முன் கூட்டியே உருவாக்கப்பட்ட டேக்குகளை வழங்குகின்றது.HTML மொழியை பயன்படுத்தும் பொழுது நாமாக டேக்குகளை உருவாக்கி பயன்படுத்த முடியாது.ஆனால் XML உபயோகிக்கும் பொழுது பயன்பாட்டிற்கு ஏற்ப நாமாக டேட்டாவை விவரிக்க கூடிய டேக்குகளை பயன்படுத்தலாம்.

சான்று HTML நிரல் (பகுதி மட்டும்)-1

<B> My Book</B>
<P>
    Rama samy</br>
     Technical Book Publication</br>
     Rs 500</br>
</p>
     மேலே உள்ளது ஒரு HTML நிரலின் ஒரு பகுதியாகும்.இது ஒரு புத்தகத்தின் ஆசிரியர்,பதிப்பகம்,விலை ஆகியவற்றை காண்பிக்க பயன் படுகின்றது.எனினும் அவற்றை தெளிவாக விவரிக்கவில்லை.டேக்குகளானது அவற்றை எவ்வாறு காட்சி படுத்தப்பட வேண்டும் என்பதாகவே உள்ளது.



சான்று XML நிரல்(பகுதி மட்டும்)-2.


<BOOK>
<NAME>Learn Html</NAME>
<AUTHOR>Anitha</AUTHOR>
<PUBLISHER> Technical boo publication</PUBLISHER>
<PRICE>Rs 500</PRICE>
</BOOK>
மேலே உள்ளது XML நிரலின் ஒரு பகுதியாகும்.இவை உள்ளடக்கத்தை தெளிவாக புரிந்து கொள்ளக்கூடிய டேக்குகளை பயன்படுத்தியிருக்கின்றது.இவை நிரலாளரால் சொந்தமாக உருவாக்கப்பட்ட டேக்குகளாகும்.

டேட்டா பரிமாற்றம்.

டேட்டா பரிமாற்றம் என்பது வாணிக நடவடிக்கைகளுக்கு பெரிதும் பயன்படுகின்றது.வெவ்வேறு படிவத்தில் உருவாக்கப்பட்ட டேட்டாவை பரிமாறுவது என்பது வணிகத்துறையை பொறுத்தவரை ஒரு சவாலாகவே உள்ளது XML எல்லா வ்கையான கணினியாலும் புரிந்து கொள்ளக்கூடிய பொதுவான படிவத்தை வழங்குகின்றது.இது டேட்டாவை உரை படிவத்தில் (TEXT FORMAT)சேமிக்கின்றது.இது தெளிவான, எளிதாக உருவாக்கக்கூடிய , எளிதாக வாசிக்கக்கூடிய கோப்புகளை உருவாக்கப் பயன்படுகின்றது.


எளிய தேடும் வசதி.


HTML ஆனது முன் கூட்டியே வடிவமைக்கப்பட்ட டேக்குகளை பயன்படுத்துவதால் HTML டாக்குமென்ட்களில் தேடுவது என்பது கடினமானதாகவே உள்ளது.

சான்று HTML நிரல்(பகுதி மட்டும்)-3


<B>Titanic</B>won the best picture award.
The story was about a ship called<B>Titanic</B>.

மேலே உள்ள நிரலில் Titanic என்பது திரைப்படமா அல்லது கப்பலின் பெயரா என்பதை சரியாக புரிந்து கொள்ள முடியாது.

சான்று XML  நிரல்(பகுதி மட்டும்)-4


<FILM>Titanic</FILM>won the best picture award.
The story was about a ship called<SHIP>Titanic</SHIP>

மேலே உள்ள நிரலில் Titanic என்பது முதல் வரியில் திரைப்படத்தின் பெயர் என்றும் இரண்டாவது வரியில் Titanic என்பது கப்பலின் பெயர் என்றும் தேடுபொறியால் எளிதாக புரிந்து கொள்ள முடியும்.


டேட்டாவை புதுப்பிக்கும் தன்மை.
HTML டாக்குமென்ட்களில் டேட்டா புதுப்பிக்கப்படும் பொழுது டேட்டாவானது சர்வரில் இருந்து பதிவிறக்கப்படுவதால் முழுப்பக்கமும் புதுபிக்கப்பட வேண்டும்.இது புதுப்பிப்பதை தாமதமாக்குகின்றது.எனினும் XML டாக்குமெண்ட்களில் முழுபக்கமும் பதிவிறக்கப்படாமல் புதுப்பிக்கப்பட வேண்டிய பகுதி மட்டும் பதிவிறக்கம் ஆகின்றது. உதாரணமாக புத்தகத்தின் விலை மட்டும் புதுப்பிக்கப்பட வேண்டும் என்றால் அது மட்டும் புதுப்பிக்கப்படுகின்றது.

பயனாளாரால் தேர்ந்தெடுக்கப்பட்ட டேட்டா மட்டும்.

HTML டாக்குமெண்ட்களில் ஒரே தகவலை வெவ்வேறு படிவத்தில் காண்பிப்பதற்கு வெவ்வேறு HTML பக்கங்கள் உருவாக்கப்பட வேண்டும்.ஏனெனில் HTML பக்கங்களில் தகவல் மட்டுமல்லாது அவற்றை எவ்வாறு காட்சிபடுத்தப்பட வேண்டும் என்பதும் குறிப்பிடப்பட்டிருக்கும்.XML என்பது டேட்டாவை விவரிக்கின்றதே அன்றி அவற்றை எவ்வாறு காட்சிப்படுத்தப் படவேண்டும் என்பதை குறிப்பிடுவதில்லை. XML டாக்குமெண்ட்களை குறிப்பிட்ட வடிவத்தில் காண்பிப்பதற்கு CSS(CASCADED STYLE SHEETS) உபயோகப்படுத்தலாம்.
 இவ்வாறு டேட்டாவையும் அதை எவ்வாறு காட்சிபடுத்தப்பட வேண்டும் என்பதையும் தனியாக பிரிப்பது நிறைய நண்மைகளை தருகின்றது. முதலாவது ஒரு XML கோப்பை பதிவிறக்கம் செய்து அவற்றை வெவ்வேறு STYLE SHEET உபயோகித்து வெவ்வேறு படிவங்களில் காட்சிப்படுத்தலாம்.ஒரு பயனர் குறிப்பிட்ட பதிவுகளை மட்டும் தேர்ந்தெடுத்து மற்றும் தேர்ந்தெடுத்த பதிவுகளை மட்டும் sort செய்தும் பயன்படுத்தலாம்.

XML டாக்குமென்ட் உருவாக்கும் முறை

உதாரணத்திற்கு ராம் & கோ என்கின்ற இணைய வர்த்தக அதன் டேட்டாவை மையப்படுத்தப்பட்ட முறையில் சேமிக்க விரும்புகின்றது.
அதன் டேட்டாவானது அதன் Accounts மற்றும் Sales துறைகளில் அணுகப்பட வேண்டும் என நிணைக்கின்றது.மேலும் அந்த டேட்டாவானது pc மட்டும் அல்லாது அதன் விற்பனைத்துறையால்  tablet மற்றும் cell phone போன்றவற்றிலும்அணுக விரும்புகின்றது.
அதன் பொருட்களின் விவரங்களானது அதன் பெயர், அதனைப்பற்றிய  விவரம்,விலை,இருப்பு எண்ணிக்கை போன்றவையாகும்.

வழி முறைகள்:

1.   எல்லா வகையான கருவிகளிலும் அணுகும் படியான பொதுவான படிவத்தை தேர்ந்தெடுத்தல்.
2.   டாக்குமெண்ட்டின் அமைப்பை(structure) தேர்ந்தெடுத்தல்
3.   XML டாக்குமென்ட்டை உருவாக்குதல்
4.   உலாவியில் பார்த்தல்

எல்லா வகையான கருவிகளிலும் அணுகும் படியான பொதுவான படிவத்தை தேர்ந்தெடுத்தல்

எல்லா விதமான கருவிகளிலும் அணுகும் படியான வடிவத்தை XML வழங்குகின்றது.மேற்கண்டுள்ள சூழ்நிலையில் டேட்டாவானது mainframe முதல் மொபைல் போன் வரை அணுக வேண்டிடியிருக்கும். விற்பானையாளர்கள் சாலைகளிருந்த படியே டேப்லெடிலோ அல்லது மொபைலிலோ அணுக வேண்டியிருக்கலாம். கணக்கு பிரிவில் உள்ளவர்கள் அலுவலகத்திலிருந்த படியே பெர்சனல் கம்ப்யூட்டரில் டேட்டாவை அணுக வேண்டியிருக்கலாம்.எல்லாருக்குமான பொதுவான படிவத்தை XML வழங்கும்.

டாக்குமெண்ட்டின் அமைப்பை(structure) தேர்ந்தெடுத்தல்.

XML டாக்குமென்ட்டை உருவாக்கும் முன் அதற்கான ஸ்ட்ரக்சரை தேர்ந்தெடுக்க வேண்டும். அதற்கான படிநிலையை(hierarchical order) தேர்ந்தெடுக்க வேண்டும்.ஒரு XML டாக்குமெண்டானது நிறைய கூறுகளை(components) கொண்டிருக்கும். அவையாவன:
1. அறிவிப்பு(declaration)
2. டேக்குகள்(tags)
3. கூறுகள்(Elements)
4. உள்ளடக்கம்(content)
5. பண்புகள்(Attributes)
6. உருபொருள்(entity)
7. குறிப்புகள்(comments)

அறிவிப்பு(DECLRATION)

XML பொதுவாக declaration உடன் தொடங்குகின்றது. இது processing instruction எனவும் அழைக்கப்படுகின்றது.இது XML FILE எவ்வாறு செயல் பட வேண்டும் என்பதை இது அறிவிக்கின்றது.அது பின் வருமாறு இருக்கலாம்.
<?xml version=”1.0” encoding=”UTF-8” ?>
இந்த statement பழைய வெர்சன்களில் optional ஆக இருந்தது. புதிய வெர்சன்களில் கட்டாயம் ஆகும்.மேலே உள்ள அறிவிப்பில் வெர்சன் 1.0 என உள்ளது.
Encoding என்பது எந்த character set இந்த டாக்குமென்டில் உபயோகப் படுத்தப்பட்டுள்ளது என்பதைக் குறிக்கின்றது.UTF-8  என்பது ஆங்கில மொழியைக் குறிக்கின்றது.

டேக்குகள்(tags)

XML –ல் டேக்குகளானது நாம் குறிப்பிடும் தகவலின் (information) பெயரைக் குறிப்பிடப் பயன்படுகின்றது. டேட்டாவானது டேக்குகள் மூலம் மார்க்அப் செய்யப்படுகின்றது.டேக்குகளானது ஆரம்ப மற்றும் முடிவில் angular bracket (<>)கொண்டுள்ளது. டேக்குகளானது ஒரு ஜோடிகளாகவே அமைகின்றது. ஒவ்வொரு ஜோடியும் ஆரம்ப டேக் மற்றும் முடிவு டேக் கொண்டுள்ளது. முடிவு டேக் ஆனது ஸ்லாஸ்(/) உடன் ஆரம்பிகின்றது.
உதாரணமாக HTML-ல் பின் வருமாரு ஒரு தகவல் மார்க் அப் செய்யப் படலாம்.
<p> RAMAN</p>
மேலே உள்ள <p>  ஆனது HTML-ல் predefined ஆகும். இது மேலே உள்ள தகவல் paragraph என்பதைக் குறிக்கின்றது. இதுவே XML-ல் நாமாக டேக்குகளை உருவாக்கலாம்.
<STU_NAME> GANESH </STU_NAME>
மேலே உள்ள தகவலில் <STU_NAME> என்ற டேகு ஆனது pre-defined கிடையாது. நாமாக GANESH என்ற தகவலை STU_NAME என மார்க் அப் செய்துள்ளோம்.

கூறுகள்(elements)

Elements என்பது அடிப்படை unit ஆகும் . இது தகவலை அறியவும் விவரிக்கவும் பயன்படுகின்றது. இதுவே ஒரு XML டாக்குமெண்டின்  அடிப்படை கட்டுமான அமைப்பாகும். XML ஆனது ஒவ்வொரு ELEMENT ஆனதும் அதற்குறிய பெயரை குறிப்பிட நம்மை அனுமதிக்கின்றது. உதாரணமாக
<STU_NAME>RAMAN</STU_NAME>
என்பதைக் குறிப்பிடலாம்.
ஒவ்வொரு XML டாக்குமெண்டும் ஒரு ROOT எலெமெண்டைக் கொண்டிருக்கும்.

சான்று நிரல்

<?xml version="1.0" ?>
<STUDENTS>
<STUDENT>
<FIRST_NAME> Ram </FIRST_NAME>
<LAST_NAME> Kumar</LAST_NAME>
</STUDENT>
</STUDENTS>

விளக்கம்:

மேலே உள்ள நிரலில் STUDENTS என்பது ரூட் எலெமெண்ட் ஆகும். மற்ற எலெமெண்ட்கள், சப் எலெமென்ட் ஆகும்.
. உள்ளடக்கம்(content)
ஒவ்வொரு எலெமெண்ட்டும் பின் வருவனவற்றைக் கொண்டிருக்கலாம்.
1.   டேட்டா
2.   எலெமெண்ட்
3.   டேட்டா மற்றும் எலெமெண்ட் ஆகியவற்றின் கலவை.

டேட்டா உள்ளடக்கத்தின் உதாரணம்:

   <FIRST_NAME> Ram </FIRST_NAME>

எலெமெண்ட் உள்ளடக்கத்தின் உதாரணம்.

<STUDENT>
<FIRST_NAME> Ram </FIRST_NAME>
<LAST_NAME> Kumar</LAST_NAME>
</STUDENT>
டேட்டா மற்றும் எலெமெண்ட் ஆகியவற்றின் கலவை.
<PRODUCTS>
 The product is available in three colors.
 <COLOR>Red</COLOR>
 <COLOR>Blue</COLOR>
 <COLOR>Green</COLOR>
 </PRODUCTS>

பண்புகள்(Attributes)

இது எலெமெண்ட் பற்றிய கூடுதல் தகவலைக் குறிப்பிட பயன்படுகின்றது.
<PRODUCT PRID=”A001”> television </PRODUCT>
மேலே உள்ளதில் PRID என்பது PRODUCT என்ற எலெமெண்டின் கூடுதல்  தகவலை குறிப்பிடப் பயன்படுகின்றது.ஒரு எலெமென்ட் ஆனது ஒன்று அல்லது ஒன்றிற்கும் மேற்பட்ட பண்புகளைக் கொண்டிருக்கலாம்.
பொதுவாக ஒரு எலெமெண்டில் அதை மேலும் qualify செய்யப்பயன் படுகின்றது.

உருபொருள்(entity)

உருபொருள் என்பது தகவலின் shortcut ஆக பயன்படுகின்றது. ஒரு டேட்டா தொகுதியின் பெயருடன் associate செய்ய பயன்படுகின்றது.ஒரு டேட்டா என்பது டெக்ஸ்டின் தொகுதியாகவோ ஒரு எக்ஸ்டெர்னல் ஃபைலின் ரெஃபெரென்ஸ் ஆகவோ இருக்கலாம்.

உதாரணம்:

<COMMENT> This is rerefence to article published in &tc; on nov 2015</COMMENT>

வெளியீடு:

This is rerefence to article published in Tamil computer on nov 2015.
இங்கு &tc என்பது Tamil computer என்பதின் short cut ஆக பயன்படுகின்றது.

குறிப்புகள்(comments)

Comments என்பது நிரலைப் பற்றிய விளக்கங்களை குறிப்பிட பயன் படுகின்றது. இது XML கோப்பை டாக்குமெண்டேசன் செய்ய பயன்படுகின்றது. Comments ஆனது ஆரம்பத்தில் ஒரு ஆங்குலர் ப்ராக்கெட் அதன் தொடர்ச்சியாக ஆச்சர்யக் குறி, அதன் தொடர்சியாக இரண்டு ஹைபன்கள் உடன்(<!--) ஆரம்பிக்கின்றது. முடிகையில் இரண்டு ஹைபன்கள் மற்றும் ஆங்குலர் ப்ராக்கெடுடன் முடிகின்றது.

உதாரணம்:

<!—PRODUCTS is the root element -->

XML டாக்குமென்ட்டை உருவாக்குதல்.

மேலே குறிப்பிட்டவாறு XML டாக்குமெண்டானது அமைகின்றது.

சான்று நிரல்:

<PRODUCTS>
<PRODUCT ID="A1">
<NAME> TOY</NAME>
<PRICE> RS 300</PRICE>
<QTY>20</QTY>
</PRODUCT>
</PRODUCTS>
லாவியில் பார்த்தல் :
மேலே உள்ள டாக்குமெண்டின் வெளிப்பாடு உலாவியில் பின்வருமாரு அமையலாம்.







 இவ்வாறு ஒரு XML டாக்குமெண்டானது உருவாக்கப்படுகின்றது.

                        -முத்து கார்த்திகேயன்,மதுரை







No comments:

Post a Comment