SAS ट्यूटोरियल: PROC प्रारूप के साथ बनाना श्रेणियाँ
28 फ़रवरी 2008 द्वारा: 7 पलक जब एक काउहोट जनसंख्या पर प्रदर्शन डाटा विश्लेषण, यह अक्सर विशेषताएँ श्रेणीबद्ध करना वांछनीय है कई मूल्यों हो सकता है. आयु, आय स्तर और क्रेडिट कार्ड स्कोर जनसंख्या गुण के उदाहरण है कि 'बाल्टी में रखा जा सकता है और आसानी से व्यापक श्रेणियों के आधार पर (रेखीय या रसद निकासी का सहारा के बिना) का विश्लेषण कर रहे हैं. जबकि चर जल्दी बयान यदि इनकोडिंग का प्रयोग हो सकता है, SAS प्रारूप प्रक्रिया अधिक सुरुचिपूर्ण और पोर्टेबल समाधान प्रदान करता है.
पूर्व आवश्यक वस्तुएँ
- SAS v9.x या SAS Enterprise गाइड 4.x
- SAS डाटा चरण के आधारभूत ज्ञान
- कैसे और लोड करने के लिए SAS कार्यक्रमों पर अमल की बुनियादी ज्ञान
- कैसे और लोड करने के लिए SAS डेटा सेट को बचाने के आधारभूत ज्ञान
- है SAS पढ़ने के लिए प्रवेश / फ़ाइल अंतरिक्ष लिखना
डाउनलोड
- वर्गीकरण परियोजना (उदाहरण के फाइल ही, सभी कार्यक्रम शामिल हैं)
- SAS कार्यक्रम: cat1
- SAS कार्यक्रम: cat2
- SAS डेटा सेट करें: nameage (यह आपकी निर्देशिका काम करने के लिए सेट डेटा चाल)
परिदृश्य

प्रदान की डाटा सेट लोगों के एक यादृच्छिक समूह के बारे में मूल जानकारी शामिल हैं. आंकड़ों को देखकर सेट, वहाँ तीन पहला नाम का प्रतिनिधित्व कॉलम, अंतिम नाम और प्रत्येक व्यक्ति के उम्र के हैं. लगता है कि कुछ प्रदर्शन विश्लेषण प्रदान की आबादी पर प्रदर्शन किया जाएगा - उम्र के categorizing हो समझदार प्रवृत्तियों के लिए उपयोगी हो सकता है.
1 लो - साथ वर्गीकरण बयान यदि
लगता है आप के लिए है 10: 10-19, 20-29, 30-39 और 40 की उम्र में वर्गीकृत चाहते +. इनपुट डेटा SAS आंकड़े कदम में लोड किया जा सकता है और यदि बयान का उपयोग कर एक वर्गीकृत परिवर्तनीय बनाने के द्वारा दिए गए. विशेष रूप से, हम निम्नलिखित कर सकते हैं:
- बनाएँ एक नया डेटा सेट, स्रोत के रूप में प्रदान की डाटा का उपयोग
- एक वर्ग चर बनाएँ
- वर्गीकृत आयु, वर्ग चर में परिणाम दे
खुला SAS कार्यक्रम cat1.sas (SAS Enterprise गाइड 4 का उपयोग वैकल्पिक रूप से cat1 कोड आइकन SAS परियोजना डिजाइनर खिड़की पर वर्गीकरण परियोजना और फ़ाइल डबल क्लिक कर सकते हैं खुले उन).

जैसा कि आप ऊपर के स्क्रीनशॉट में देख सकते हैं, कोड एक नया डेटा पुस्तकालय काम में catv1 फोन सेट बनाता है.
- डिफ़ॉल्ट इनपुट nameage डेटा को सेट इस ट्यूटोरियल द्वारा प्रदान की निर्धारित है
- एक 16-चरित्र चर नामक age_category को उम्र चर का शाब्दिक वर्गीकरण पकड़ बनाई है
- यदि कोई / ELSEIF सशर्त संरचना के लिए प्रत्येक रिकॉर्ड में भागीदार वर्ष की आयु के लिए बाल्टी वर्गीकरण गणना प्रयोग किया जाता है
आंकड़े कदम के बाद, एक PROC प्रिंट करने catv1 के उत्पादन में प्रदर्शन जारी है

Cat1 कोड के रूप में उत्पादन का उत्पादन दिखाया ऊपर चाहिए रनिंग
2 लो - कस्टम प्रारूप का उपयोग कर वर्गीकरण
यदि प्रयोग / ELSIF बयान आसान है और शायद पर्याप्त हैं तो आप केवल एक चर ... जानते हुए भी कि तुम वही वर्गीकरण कोड का एक टुकड़ा में कभी कभी प्रयोग करने या विभिन्न चर के साथ ही वर्गीकरण इस्तेमाल करेंगे वर्गीकृत किया है. यदि आप इन शर्तों तो गारंटी नहीं / कर सकते हैं आप कॉपी में फंस जाएगा पेस्ट कोडन जाल. वर्गीकरण के लिए कोई "परिवर्तन" के लिए हो कोड के प्रत्येक भाग में प्रत्येक चर के लिए मैन्युअल रूप से reconfigured होगा - एक समय लेने वाली और त्रुटि-प्रवण प्रक्रिया.
सौभाग्य से, SAS प्रारूप प्रक्रिया है, जो चरित्र या संख्यात्मक इनपुट के लिए केंद्रीकृत वर्गीकरण पैदा किया जा सकता है प्रदान करता है. प्रारूप प्रक्रिया का उपयोग कर के लाभ में निम्नलिखित शामिल हैं:
- एकाधिक प्रारूपों SAS प्रोग्राम में चर के किसी भी संख्या के लिए लागू किया जा सकता
- स्वरूप में परिवर्तन एक लक्ष्य चर अगली बार अपनी जिम्मेदारी कोड को लागू किया जाएगा मार डाला
- लचीलापन प्रोग्राम कोड में प्रारूपों एम्बेड करने के लिए या स्वयं में निहित बनाने के कार्यक्रम
- प्रारूप अस्थायी या स्थायी SAS पुस्तकालय में संग्रहीत किया जा सकता है
जो मन में के साथ, चलो rework एक प्रारूप प्रक्रिया के साथ सशर्त संरचना की जगह द्वारा इस कोड. खुला SAS कार्यक्रम cat2.sas कोड को देखने के लिए.

प्रारूप प्रक्रिया एक PROC प्रारूप बयान के साथ शुरू होता है और समाप्त होता है एक भाग के बयान (असंवेदनशील मामले) के साथ. इस संरचना के भीतर मूल्य के बयान पर एक प्रारूप परिभाषित किया जा सकता है. एकाधिक मूल्य बयान एक प्रारूप प्रक्रिया के भीतर जारी किए जा सकता है.
इस मामले में हम एक प्रारूप agecat परिभाषित किया. इस प्रारूप में संख्यात्मक पाठ इनपुट मूल्यों तब्दील श्रेणियों के आधार पर होगा. स्थान (ध्यान दें: पाठ इनपुट मूल्यों को बदलने, एक प्रारूप नाम - agecat डॉलर के सामने $).
एकल इनपुट मूल्यों या इनपुट मूल्यों की सीमाओं सरल समीकरण द्वारा प्रारूप मूल्यों को सौंपा है. इस मामले में, इनपुट मूल्यों के बीच है (जैसे 10-19) एक पाठ के आधार पर, स्वरूपित मूल्यों को सौंपा है.
सेट कीवर्ड उच्च डेटा में सबसे बड़ा संभावित मूल्य का प्रतीक है. इस कीवर्ड को अनिवार्य रूप से एक पकड़ है सभी रेंज के शुरू से अधिक मूल्य के लिए. इस प्रयोक्ता के रूप में, किसी भी इनपुट मूल्य से ऊपर 40 प्रारूप पर लागू स्वरूपित '40 मूल्य निर्दिष्ट किया जाएगा '+. इसी प्रकार, खोजशब्द कम से कम संभव मूल्य डेटा प्रतिनिधित्व करते हैं और एक तल में इस्तेमाल किया जा सकता के अंत पकड़ने के सभी वर्ग प्रयोग किया जा सकता है.
हमारे प्रयोक्ता-प्रारूप परिभाषित अब डाला बयान के जरिए किसी भी न्यूमेरिक चर को आवेदन किया जा सकता है. एक परिणाम के रूप में, डेटा कदम नहीं सशर्त बयान जटिल आवंटित करने की आवश्यकता है और एक लाइन में age_category मूल्यों को वर्गीकृत कर सकते हैं.
बस उपयोगकर्ता का लचीलापन प्रदर्शित करने के प्रारूपों, एक नया चर age_in_5 बुलाया परिभाषित भी बनाया गया था. यह चर क्या आयु वर्ग के एक व्यक्ति अब से 5 साल की होगी दिखाता है. ध्यान दें कि काम के बयान कि स्वरूपण से पहले 5 साल है उम्र शामिल किया गया है छोड़कर age_category के समान है.
आंकड़े कदम के बाद, एक PROC प्रिंट करने catv2 के उत्पादन में प्रदर्शन जारी है

Cat2 कोड के रूप में उत्पादन का उत्पादन दिखाया ऊपर चाहिए रनिंग









धन्यवाद आदमी
धन्यवाद, सच में अच्छा है और सहायक
महान! अभी के लिए मैं क्या देख रहा था!