BMS, BUS, ଶିଳ୍ପ, ଉପକରଣ କେବୁଲ ପାଇଁ।

ବସନ୍ତ ମହୋତ୍ସବ ଶେଷ ହେବା ସହିତ, ଡିପସିକ୍ ଚାରିପାଖରେ ଉତ୍ସାହ ପ୍ରବଳ ରହିଛି। ସାମ୍ପ୍ରତିକ ଛୁଟିଦିନ ଟେକ୍ ଶିଳ୍ପ ମଧ୍ୟରେ ପ୍ରତିଯୋଗିତାର ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଭାବନାକୁ ଉଜ୍ଜ୍ୱଳ କରିଛି, ଅନେକ ଏହି "କ୍ୟାଟ୍ଫିସ୍" ବିଷୟରେ ଆଲୋଚନା ଏବଂ ବିଶ୍ଳେଷଣ କରିଛନ୍ତି। ସିଲିକନ୍ ଭ୍ୟାଲି ଏକ ଅଭୂତପୂର୍ବ ସଙ୍କଟର ସମ୍ମୁଖୀନ ହେଉଛି: ମୁକ୍ତ-ଉତ୍ସର ସମର୍ଥକମାନେ ପୁଣି ଥରେ ସେମାନଙ୍କର ମତାମତ ପ୍ରକାଶ କରୁଛନ୍ତି, ଏବଂ ଓପନ୍ଏଆଇ ମଧ୍ୟ ଏହାର ବନ୍ଦ-ଉତ୍ସ ରଣନୀତି ସର୍ବୋତ୍ତମ ପସନ୍ଦ ଥିଲା କି ନାହିଁ ତାହା ପୁନଃମୂଲ୍ୟାୟନ କରୁଛି। କମ୍ କମ୍ପ୍ୟୁଟେସନାଲ୍ ଖର୍ଚ୍ଚର ନୂତନ ଉଦାହରଣ Nvidia ପରି ଚିପ୍ ଜାଏଣ୍ଟମାନଙ୍କ ମଧ୍ୟରେ ଏକ ଶୃଙ୍ଖଳିତ ପ୍ରତିକ୍ରିୟା ସୃଷ୍ଟି କରିଛି, ଯାହା ଆମେରିକା ଷ୍ଟକ୍ ବଜାର ଇତିହାସରେ ଏକ-ଦିନର ବଜାର ମୂଲ୍ୟ କ୍ଷତି ରେକର୍ଡ କରିଛି, ଯେତେବେଳେ ସରକାରୀ ଏଜେନ୍ସିଗୁଡ଼ିକ ଡିପସିକ୍ ଦ୍ୱାରା ବ୍ୟବହୃତ ଚିପ୍ସର ଅନୁପାଳନ ତଦନ୍ତ କରୁଛନ୍ତି। ବିଦେଶରେ ଡିପସିକ୍ ର ମିଶ୍ରିତ ସମୀକ୍ଷା ମଧ୍ୟରେ, ଘରୋଇ ସ୍ତରରେ, ଏହା ଅସାଧାରଣ ଅଭିବୃଦ୍ଧି ଅନୁଭବ କରୁଛି। R1 ମଡେଲ୍ ଲଞ୍ଚ ହେବା ପରେ, ସମ୍ପୃକ୍ତ ଆପ୍ ଟ୍ରାଫିକରେ ବୃଦ୍ଧି ପାଇଛି, ଯାହା ସୂଚାଇଛି ଯେ ଆପ୍ଲିକେସନ୍ କ୍ଷେତ୍ରଗୁଡ଼ିକରେ ଅଭିବୃଦ୍ଧି ସାମଗ୍ରିକ AI ଇକୋସିଷ୍ଟମକୁ ଆଗକୁ ବଢାଇବ। ସକାରାତ୍ମକ ଦିଗ ହେଉଛି ଯେ ଡିପସିକ୍ ଆପ୍ଲିକେସନ୍ ସମ୍ଭାବନାକୁ ବିସ୍ତାର କରିବ, ଯାହା ସୂଚାଇ ଦିଏ ଯେ ChatGPT ଉପରେ ନିର୍ଭର କରିବା ଭବିଷ୍ୟତରେ ଏତେ ମହଙ୍ଗା ହେବ ନାହିଁ। ଏହି ପରିବର୍ତ୍ତନ OpenAI ର ସାମ୍ପ୍ରତିକ କାର୍ଯ୍ୟକଳାପରେ ପ୍ରତିଫଳିତ ହୋଇଛି, ଯେଉଁଥିରେ DeepSeek R1 ର ପ୍ରତିକ୍ରିୟାରେ ମୁକ୍ତ ବ୍ୟବହାରକାରୀଙ୍କ ପାଇଁ o3-ମିନି ନାମକ ଏକ ଯୁକ୍ତିଯୁକ୍ତ ମଡେଲର ବ୍ୟବସ୍ଥା, ଏବଂ ପରବର୍ତ୍ତୀ ଅପଗ୍ରେଡ୍ ଯାହା o3-ମିନିର ଚିନ୍ତାଧାରାକୁ ସାର୍ବଜନୀନ କରିଥିଲା। ଅନେକ ବିଦେଶୀ ବ୍ୟବହାରକାରୀ ଏହି ବିକାଶ ପାଇଁ DeepSeek ପ୍ରତି କୃତଜ୍ଞତା ପ୍ରକାଶ କରିଛନ୍ତି, ଯଦିଓ ଏହି ଚିନ୍ତାଧାରା ଏକ ସାରାଂଶ ଭାବରେ କାର୍ଯ୍ୟ କରେ।
ଆଶାବାଦୀ ଭାବରେ, ଏହା ସ୍ପଷ୍ଟ ଯେ DeepSeek ଘରୋଇ ଖେଳାଳିମାନଙ୍କୁ ଏକତ୍ର କରୁଛି। ତାଲିମ ଖର୍ଚ୍ଚ ହ୍ରାସ କରିବା ଉପରେ ଧ୍ୟାନ ଦେଇ, ବିଭିନ୍ନ ଅପଷ୍ଟ୍ରିମ୍ ଚିପ୍ ନିର୍ମାତା, ମଧ୍ୟବର୍ତ୍ତୀ କ୍ଲାଉଡ୍ ପ୍ରଦାନକାରୀ ଏବଂ ଅନେକ ଷ୍ଟାର୍ଟଅପ୍ ସକ୍ରିୟ ଭାବରେ ଇକୋସିଷ୍ଟମରେ ଯୋଗ ଦେଉଛନ୍ତି, DeepSeek ମଡେଲ୍ ବ୍ୟବହାର କରିବା ପାଇଁ ଖର୍ଚ୍ଚ ଦକ୍ଷତା ବୃଦ୍ଧି କରୁଛନ୍ତି। DeepSeek ର କାଗଜପତ୍ର ଅନୁଯାୟୀ, V3 ମଡେଲର ସମ୍ପୂର୍ଣ୍ଣ ତାଲିମ ପାଇଁ କେବଳ 2.788 ନିୟୁତ H800 GPU ଘଣ୍ଟା ଆବଶ୍ୟକ, ଏବଂ ତାଲିମ ପ୍ରକ୍ରିୟା ଅତ୍ୟନ୍ତ ସ୍ଥିର। 405 ବିଲିୟନ ପାରାମିଟର ସହିତ ଲାମା 3 ତୁଳନାରେ ଦଶ ଗୁଣକ ଦ୍ୱାରା ପ୍ରାକ୍-ପ୍ରଶିକ୍ଷଣ ଖର୍ଚ୍ଚ ହ୍ରାସ କରିବା ପାଇଁ MoE (ବିଶେଷଜ୍ଞଙ୍କ ମିଶ୍ରଣ) ସ୍ଥାପତ୍ୟ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ବର୍ତ୍ତମାନ, V3 ହେଉଛି ପ୍ରଥମ ସାର୍ବଜନୀନ ଭାବରେ ସ୍ୱୀକୃତ ମଡେଲ୍ ଯାହା MoE ରେ ଏତେ ଉଚ୍ଚ ସ୍ପର୍ସିଟି ପ୍ରଦର୍ଶନ କରୁଛି। ଏହା ସହିତ, MLA (ମଲ୍ଟି ଲେୟର ଆଟେନସନ୍) ସମନ୍ୱୟଶୀଳ ଭାବରେ କାମ କରେ, ବିଶେଷକରି ଯୁକ୍ତି ଦିଗଗୁଡ଼ିକରେ। "MoE ଯେତେ ସ୍ପର୍ସ ହେବ, କମ୍ପ୍ୟୁଟେସନାଲ୍ ଶକ୍ତିକୁ ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ ବ୍ୟବହାର କରିବା ପାଇଁ ଯୁକ୍ତି ସମୟରେ ବ୍ୟାଚ୍ ଆକାର ଆବଶ୍ୟକ ହେବ, KVCache ର ଆକାର ହେଉଛି ମୁଖ୍ୟ ସୀମିତକାରୀ କାରକ; MLA KVCache ଆକାରକୁ ଉଲ୍ଲେଖନୀୟ ଭାବରେ ହ୍ରାସ କରେ," AI ଟେକ୍ନୋଲୋଜି ସମୀକ୍ଷା ପାଇଁ ଏକ ବିଶ୍ଳେଷଣରେ ଚୁଆନଜିଂ ଟେକ୍ନୋଲୋଜିର ଜଣେ ଗବେଷକ ଉଲ୍ଲେଖ କରିଛନ୍ତି। ସାମଗ୍ରିକ ଭାବରେ, ଡିପସିକର ସଫଳତା କେବଳ ଗୋଟିଏ ପ୍ରଯୁକ୍ତିବିଦ୍ୟା ନୁହେଁ, ବିଭିନ୍ନ ପ୍ରଯୁକ୍ତିର ମିଶ୍ରଣରେ ନିହିତ। ଶିଳ୍ପ ସମ୍ପର୍କୀୟମାନେ ଡିପସିକ ଦଳର ଇଞ୍ଜିନିୟରିଂ କ୍ଷମତାକୁ ପ୍ରଶଂସା କରନ୍ତି, ସମାନ୍ତରାଳ ତାଲିମ ଏବଂ ଅପରେଟର ଅପ୍ଟିମାଇଜେସନରେ ସେମାନଙ୍କର ଉତ୍କର୍ଷତାକୁ ଉଲ୍ଲେଖ କରି, ପ୍ରତ୍ୟେକ ବିବରଣୀକୁ ପରିଷ୍କାର କରି ଯୁଗାନ୍ତକାରୀ ଫଳାଫଳ ହାସଲ କରନ୍ତି। ଡିପସିକର ମୁକ୍ତ-ଉତ୍ସ ପଦ୍ଧତି ବଡ଼ ମଡେଲର ସାମଗ୍ରିକ ବିକାଶକୁ ଆହୁରି ଇନ୍ଧନ ପ୍ରଦାନ କରେ, ଏବଂ ଏହା ଆଶା କରାଯାଉଛି ଯେ ଯଦି ସମାନ ମଡେଲଗୁଡ଼ିକ ଚିତ୍ର, ଭିଡିଓ ଏବଂ ଅନ୍ୟାନ୍ୟ କ୍ଷେତ୍ରରେ ବିସ୍ତାରିତ ହୁଏ, ତେବେ ଏହା ସମଗ୍ର ଶିଳ୍ପରେ ଚାହିଦାକୁ ଯଥେଷ୍ଟ ଭାବରେ ଉତ୍ସାହିତ କରିବ।
ତୃତୀୟ-ପକ୍ଷ ଯୁକ୍ତି ସେବା ପାଇଁ ସୁଯୋଗ
ତଥ୍ୟ ସୂଚାଇ ଦେଉଛି ଯେ ଏହାର ମୁକ୍ତି ପରଠାରୁ, DeepSeek ମାତ୍ର 21 ଦିନ ମଧ୍ୟରେ 22.15 ନିୟୁତ ଦୈନିକ ସକ୍ରିୟ ଉପଭୋକ୍ତା (DAU) ସଂଗ୍ରହ କରିଛି, ଯାହା ChatGPT ର ଉପଭୋକ୍ତା ଆଧାରର 41.6% ହାସଲ କରିଛି ଏବଂ Doubao ର 16.95 ନିୟୁତ ଦୈନିକ ସକ୍ରିୟ ଉପଭୋକ୍ତାଙ୍କୁ ଅତିକ୍ରମ କରିଛି, ଏହିପରି ବିଶ୍ୱ ସ୍ତରରେ ସବୁଠାରୁ ଦ୍ରୁତତମ ବୃଦ୍ଧି ପାଉଥିବା ଆପ୍ଲିକେସନ୍ ହୋଇ 157 ଦେଶ/ଅଞ୍ଚଳରେ Apple App Store ଶୀର୍ଷରେ ପହଞ୍ଚିଛି। ତଥାପି, ଯେତେବେଳେ ଉପଭୋକ୍ତାମାନେ ସଂଖ୍ୟାରେ ବୃଦ୍ଧି ପାଉଥିଲେ, ସାଇବର ହ୍ୟାକର୍ସ DeepSeek ଆପ୍ ଉପରେ ନିରନ୍ତର ଆକ୍ରମଣ କରୁଛନ୍ତି, ଯାହା ଏହାର ସର୍ଭର ଉପରେ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଚାପ ସୃଷ୍ଟି କରୁଛି। ଶିଳ୍ପ ବିଶ୍ଳେଷକମାନେ ବିଶ୍ୱାସ କରନ୍ତି ଯେ ଏହା ଆଂଶିକ ଭାବରେ DeepSeek ଦ୍ୱାରା ତାଲିମ ପାଇଁ କାର୍ଡ ନିୟୋଜିତ କରିବା ସହିତ ଯୁକ୍ତି ପାଇଁ ପର୍ଯ୍ୟାପ୍ତ କମ୍ପ୍ୟୁଟେସନାଲ୍ ଶକ୍ତିର ଅଭାବ ଯୋଗୁଁ ହୋଇଛି। ଜଣେ ଶିଳ୍ପ ଅନ୍ତର୍ନିହିତ ବ୍ୟକ୍ତି AI ଟେକ୍ନୋଲୋଜି ରିଭ୍ୟୁକୁ ସୂଚନା ଦେଇଛନ୍ତି, "ଅଧିକ ମେସିନ୍ କିଣିବା ପାଇଁ ଫିସ୍ କିମ୍ବା ଆର୍ଥିକ ସହାୟତା ଦ୍ୱାରା ବାରମ୍ବାର ସର୍ଭର ସମସ୍ୟାଗୁଡ଼ିକୁ ସହଜରେ ସମାଧାନ କରାଯାଇପାରିବ; ଶେଷରେ, ଏହା DeepSeek ର ନିଷ୍ପତ୍ତି ଉପରେ ନିର୍ଭର କରେ।" ଏହା ପ୍ରଯୁକ୍ତିବିଦ୍ୟା ବନାମ ଉତ୍ପାଦୀକରଣ ଉପରେ ଧ୍ୟାନ ଦେବାରେ ଏକ ବାଣିଜ୍ୟ-ଅଫ୍ ଉପସ୍ଥାପନ କରେ। DeepSeek ଆତ୍ମନିର୍ଭର ପାଇଁ କ୍ୱାଣ୍ଟମ୍ କ୍ୱାଣ୍ଟାଇଜେସନ୍ ଉପରେ ମୁଖ୍ୟତଃ ନିର୍ଭର କରିଛି, କମ୍ ବାହ୍ୟ ପାଣ୍ଠି ପାଇଛି, ଯାହା ଫଳରେ ତୁଳନାତ୍ମକ ଭାବରେ କମ୍ ନଗଦ ପ୍ରବାହ ଚାପ ଏବଂ ଏକ ବିଶୁଦ୍ଧ ପ୍ରଯୁକ୍ତିବିଦ୍ୟା ପରିବେଶ ସୃଷ୍ଟି ହୋଇଛି। ବର୍ତ୍ତମାନ, ଉପରୋକ୍ତ ସମସ୍ୟାଗୁଡ଼ିକୁ ଦୃଷ୍ଟିରେ ରଖି, କିଛି ଉପଭୋକ୍ତା ସୋସିଆଲ ମିଡିଆରେ ଡିପସିକଙ୍କୁ ବ୍ୟବହାର ସୀମା ବୃଦ୍ଧି କରିବାକୁ କିମ୍ବା ଉପଭୋକ୍ତା ଆରାମ ବୃଦ୍ଧି କରିବା ପାଇଁ ଦେୟଯୁକ୍ତ ବୈଶିଷ୍ଟ୍ୟ ପ୍ରଚଳନ କରିବାକୁ ଅନୁରୋଧ କରୁଛନ୍ତି। ଏହା ସହିତ, ଡେଭଲପରମାନେ ଅପ୍ଟିମାଇଜେସନ୍ ପାଇଁ ଅଫିସିଆଲ୍ API କିମ୍ବା ତୃତୀୟ-ପକ୍ଷ API ବ୍ୟବହାର କରିବା ଆରମ୍ଭ କରିଛନ୍ତି। ତଥାପି, ଡିପସିକର ଖୋଲା ପ୍ଲାଟଫର୍ମ ସମ୍ପ୍ରତି ଘୋଷଣା କରିଛି, "ବର୍ତ୍ତମାନର ସର୍ଭର ସମ୍ବଳଗୁଡ଼ିକ ଅଭାବନୀୟ, ଏବଂ API ସେବା ରିଚାର୍ଜକୁ ସ୍ଥଗିତ ରଖାଯାଇଛି।"
ଏହା ନିସନ୍ଦେହରେ AI ଭିତ୍ତିଭୂମି କ୍ଷେତ୍ରରେ ତୃତୀୟ-ପକ୍ଷ ବିକ୍ରେତାଙ୍କ ପାଇଁ ଅଧିକ ସୁଯୋଗ ଖୋଲିଥାଏ। ସମ୍ପ୍ରତି, ଅନେକ ଘରୋଇ ଏବଂ ଆନ୍ତର୍ଜାତୀୟ କ୍ଲାଉଡ୍ ଜାଏଣ୍ଟ ଡ଼ିପସିକ୍ର ମଡେଲ୍ API ଲଞ୍ଚ କରିଛନ୍ତି - ବିଦେଶୀ ମହାରଥୀ ମାଇକ୍ରୋସଫ୍ଟ ଏବଂ ଆମାଜନ ଜାନୁଆରୀ ଶେଷରେ ଯୋଗ ଦେଇଥିବା ପ୍ରଥମ କମ୍ପାନୀମାନଙ୍କ ମଧ୍ୟରେ ଥିଲେ। ଘରୋଇ ନେତା, ହୁଆୱେଇ କ୍ଲାଉଡ୍, ପ୍ରଥମ ପଦକ୍ଷେପ ନେଇଥିଲା, ଫେବୃଆରୀ 1 ରେ ସିଲିକନ୍-ଭିତ୍ତିକ ଫ୍ଲୋ ସହିତ ସହଯୋଗରେ ଡିପସିକ୍ R1 ଏବଂ V3 ରିଜନିଂ ସେବା ଜାରି କରିଥିଲା। AI ଟେକ୍ନୋଲୋଜି ରିଭ୍ୟୁରୁ ରିପୋର୍ଟ ସୂଚିତ କରୁଛି ଯେ ସିଲିକନ୍-ଭିତ୍ତିକ ଫ୍ଲୋର ସେବାଗୁଡ଼ିକରେ ଉପଭୋକ୍ତାଙ୍କ ସଂଖ୍ୟା ବୃଦ୍ଧି ପାଇଛି, ଯାହା ପ୍ରଭାବଶାଳୀ ଭାବରେ ପ୍ଲାଟଫର୍ମକୁ "କ୍ରାସ୍" କରିଛି। ତିନୋଟି ବଡ଼ ଟେକ୍ କମ୍ପାନୀ - BAT (Baidu, Alibaba, Tencent) ଏବଂ ByteDance - ମଧ୍ୟ ଫେବୃଆରୀ 3 ରୁ କମ୍ ମୂଲ୍ୟର, ସୀମିତ ସମୟର ଅଫର୍ ଜାରି କରିଥିଲା, ଯାହା ଗତ ବର୍ଷର କ୍ଲାଉଡ୍ ବିକ୍ରେତା ମୂଲ୍ୟ ଯୁଦ୍ଧକୁ ମନେ ପକାଇଥାଏ ଯାହା DeepSeekର V2 ମଡେଲ୍ ଲଞ୍ଚ ଦ୍ୱାରା ପ୍ରଜ୍ଜ୍ୱଳିତ ହୋଇଥିଲା, ଯେଉଁଠାରେ ଡ଼ିପସିକ୍କୁ "ମୂଲ୍ୟ କସାଇ" ବୋଲି ଡକାଯିବା ଆରମ୍ଭ ହୋଇଥିଲା। କ୍ଲାଉଡ୍ ବିକ୍ରେତାଙ୍କ ଉନ୍ମାଦ କାର୍ଯ୍ୟଗୁଡ଼ିକ Microsoft Azure ଏବଂ OpenAI ମଧ୍ୟରେ ପୂର୍ବ ଦୃଢ଼ ସମ୍ପର୍କକୁ ପ୍ରତିଫଳିତ କରେ, ଯେଉଁଠାରେ 2019 ରେ, Microsoft OpenAI ରେ ଏକ ବିଲିୟନ ଡଲାରର ଯଥେଷ୍ଟ ନିବେଶ କରିଥିଲା ଏବଂ 2023 ରେ ChatGPT ର ଲଞ୍ଚ ପରେ ଲାଭ ପାଇଥିଲା। ତଥାପି, Meta ଓପନ୍-ସୋର୍ସଡ୍ Llama ପରେ ଏହି ଘନିଷ୍ଠ ସମ୍ପର୍କ ଭାଙ୍ଗିବା ଆରମ୍ଭ କରିଥିଲା, ଯାହା Microsoft Azure ଇକୋସିଷ୍ଟମ୍ ବାହାରେ ଥିବା ଅନ୍ୟ ବିକ୍ରେତାମାନଙ୍କୁ ସେମାନଙ୍କର ବଡ଼ ମଡେଲ୍ ସହିତ ପ୍ରତିଯୋଗିତା କରିବାକୁ ଅନୁମତି ଦେଇଥିଲା। ଏହି କ୍ଷେତ୍ରରେ, DeepSeek କେବଳ ଉତ୍ପାଦ ଉତ୍ତାପ ଦୃଷ୍ଟିରୁ ChatGPT କୁ ପଛରେ ପକାଇନାହିଁ ବରଂ o1 ରିଲିଜ୍ ପରେ ଓପନ୍-ସୋର୍ସ ମଡେଲ୍ ମଧ୍ୟ ପ୍ରଚଳନ କରିଛି, ଯାହା Llama ର GPT-3 ର ପୁନରୁଦ୍ଧାରକୁ ନେଇ ଉତ୍ସାହ ପରି।
ବାସ୍ତବରେ, କ୍ଲାଉଡ୍ ପ୍ରଦାନକାରୀମାନେ AI ଆପ୍ଲିକେସନ୍ ପାଇଁ ନିଜକୁ ଟ୍ରାଫିକ୍ ଗେଟୱେ ଭାବରେ ମଧ୍ୟ ସ୍ଥାନିତ କରୁଛନ୍ତି, ଅର୍ଥାତ୍ ଡେଭଲପରମାନଙ୍କ ସହିତ ସମ୍ପର୍କ ଗଭୀର କରିବା ପୂର୍ବରୁ ଲାଭଦାୟକ ହୋଇଥାଏ। ରିପୋର୍ଟଗୁଡ଼ିକ ସୂଚିତ କରେ ଯେ Baidu ସ୍ମାର୍ଟ କ୍ଲାଉଡ୍ ମଡେଲର ଲଞ୍ଚ ଦିନ 15,000 ରୁ ଅଧିକ ଗ୍ରାହକ Qianfan ପ୍ଲାଟଫର୍ମ ମାଧ୍ୟମରେ DeepSeek ମଡେଲ୍ ବ୍ୟବହାର କରୁଥିଲେ। ଏହା ସହିତ, ଅନେକ ଛୋଟ ଫାର୍ମ ସମାଧାନ ପ୍ରଦାନ କରୁଛନ୍ତି, ଯେଉଁଥିରେ ସିଲିକନ୍-ଆଧାରିତ ଫ୍ଲୋ, ଲୁଚେନ୍ ଟେକ୍ନୋଲୋଜି, ଚୁଆଞ୍ଜିଙ୍ଗ୍ ଟେକ୍ନୋଲୋଜି ଏବଂ ବିଭିନ୍ନ AI ଇନଫ୍ରା ପ୍ରଦାନକାରୀ ଅନ୍ତର୍ଭୁକ୍ତ ଯେଉଁମାନେ DeepSeek ମଡେଲ୍ ପାଇଁ ସମର୍ଥନ ଆରମ୍ଭ କରିଛନ୍ତି। AI ଟେକ୍ନୋଲୋଜି ସମୀକ୍ଷା ଶିଖିଛି ଯେ DeepSeek ର ସ୍ଥାନୀୟକୃତ ନିୟୋଜନ ପାଇଁ ବର୍ତ୍ତମାନର ଅପ୍ଟିମାଇଜେସନ୍ ସୁଯୋଗ ମୁଖ୍ୟତଃ ଦୁଇଟି କ୍ଷେତ୍ରରେ ରହିଛି: ଗୋଟିଏ ହେଉଛି ହାଇବ୍ରିଡ୍ GPU/CPU ଅନୁମାନ ବ୍ୟବହାର କରିବା ସମୟରେ ସ୍ଥାନୀୟ ଭାବରେ 671 ବିଲିୟନ ପାରାମିଟର୍ MoE ମଡେଲ୍ ନିୟୋଜନ କରିବା ପାଇଁ ଏକ ମିଶ୍ରିତ ଯୁକ୍ତିଯୁକ୍ତ ପଦ୍ଧତି ବ୍ୟବହାର କରି MoE ମଡେଲର ସ୍ପାର୍ସିଟି ବୈଶିଷ୍ଟ୍ୟଗୁଡ଼ିକୁ ଅପ୍ଟିମାଇଜ୍ କରିବା। ଏହା ସହିତ, MLA ର ଅପ୍ଟିମାଇଜେସନ୍ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ତଥାପି, DeepSeek ର ଦୁଇଟି ମଡେଲ୍ ନିୟୋଜନ ଅପ୍ଟିମାଇଜେସନ୍ ରେ କିଛି ଚ୍ୟାଲେଞ୍ଜର ସମ୍ମୁଖୀନ ହେଉଛନ୍ତି। "ମଡେଲର ଆକାର ଏବଂ ଅନେକ ପାରାମିଟର ଯୋଗୁଁ, ଅପ୍ଟିମାଇଜେସନ୍ ପ୍ରକୃତରେ ଜଟିଳ, ବିଶେଷକରି ସ୍ଥାନୀୟ ନିୟୋଜନ ପାଇଁ ଯେଉଁଠାରେ କାର୍ଯ୍ୟଦକ୍ଷତା ଏବଂ ମୂଲ୍ୟ ମଧ୍ୟରେ ଏକ ସର୍ବୋତ୍ତମ ସନ୍ତୁଳନ ହାସଲ କରିବା ଚ୍ୟାଲେଞ୍ଜିଂ ହେବ," ଚୁଆନଜିଂ ଟେକ୍ନୋଲୋଜିର ଜଣେ ଗବେଷକ କହିଛନ୍ତି। ସବୁଠାରୁ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ପ୍ରତିବନ୍ଧକ ହେଉଛି ମେମୋରୀ କ୍ଷମତା ସୀମାକୁ ଅତିକ୍ରମ କରିବା। "ଆମେ CPU ଏବଂ ଅନ୍ୟାନ୍ୟ କମ୍ପ୍ୟୁଟେସନାଲ ସମ୍ବଳଗୁଡ଼ିକୁ ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ ବ୍ୟବହାର କରିବା ପାଇଁ ଏକ ବିଷମ ସହଯୋଗ ପଦ୍ଧତି ଗ୍ରହଣ କରୁ, ଉଚ୍ଚ-କର୍ମଦକ୍ଷତା CPU ଅପରେଟର ବ୍ୟବହାର କରି ପ୍ରକ୍ରିୟାକରଣ ପାଇଁ CPU/DRAM ରେ ସ୍ପାର୍ସ MoE ମାଟ୍ରିକ୍ସର ଅଣ-ସେୟାର କରାଯାଇଥିବା ଅଂଶଗୁଡ଼ିକୁ ରଖିଥାଉ, ଯେତେବେଳେ ଘନ ଅଂଶ GPU ରେ ରହିଥାଏ," ସେ ଆହୁରି ବ୍ୟାଖ୍ୟା କରିଥିଲେ। ରିପୋର୍ଟଗୁଡ଼ିକ ସୂଚିତ କରେ ଯେ ଚୁଆନଜିଂର ଖୋଲା-ଉତ୍ସ ଫ୍ରେମୱାର୍କ KTransformers ମୁଖ୍ୟତଃ ଏକ ଟେମ୍ପଲେଟ୍ ମାଧ୍ୟମରେ ମୂଳ ଟ୍ରାନ୍ସଫର୍ମର୍ସ କାର୍ଯ୍ୟାନ୍ୱୟନରେ ବିଭିନ୍ନ ରଣନୀତି ଏବଂ ଅପରେଟରଗୁଡ଼ିକୁ ପ୍ରବେଶ କରାଏ, CUDAGraph ଭଳି ପଦ୍ଧତି ବ୍ୟବହାର କରି ଅନୁମାନ ଗତିକୁ ଉଲ୍ଲେଖନୀୟ ଭାବରେ ବୃଦ୍ଧି କରେ। DeepSeek ଏହି ଷ୍ଟାର୍ଟଅପ୍ ପାଇଁ ସୁଯୋଗ ସୃଷ୍ଟି କରିଛି, କାରଣ ଅଭିବୃଦ୍ଧି ଲାଭ ସ୍ପଷ୍ଟ ହେବାରେ ଲାଗିଛି; DeepSeek API ଲଞ୍ଚ କରିବା ପରେ ଅନେକ ଫାର୍ମ ଉଲ୍ଲେଖନୀୟ ଗ୍ରାହକ ବୃଦ୍ଧି ରିପୋର୍ଟ କରିଛନ୍ତି, ଅପ୍ଟିମାଇଜେସନ୍ ଖୋଜୁଥିବା ପୂର୍ବ କ୍ଲାଏଣ୍ଟମାନଙ୍କ ଠାରୁ ପଚାରଣା ଗ୍ରହଣ କରିଛନ୍ତି। ଶିଳ୍ପ ସମ୍ପର୍କୀୟମାନେ ଉଲ୍ଲେଖ କରିଛନ୍ତି ଯେ, "ପୂର୍ବରୁ, କିଛି ପ୍ରତିଷ୍ଠିତ କ୍ଲାଏଣ୍ଟ ଗୋଷ୍ଠୀଗୁଡ଼ିକ ପ୍ରାୟତଃ ବଡ଼ କମ୍ପାନୀଗୁଡ଼ିକର ମାନକୀକୃତ ସେବାରେ ଆବଦ୍ଧ ଥିଲେ, ସ୍କେଲ୍ ଯୋଗୁଁ ସେମାନଙ୍କର ମୂଲ୍ୟ ସୁବିଧା ଦ୍ୱାରା ଦୃଢ଼ ଭାବରେ ଆବଦ୍ଧ ଥିଲେ। ତଥାପି, ବସନ୍ତ ମହୋତ୍ସବ ପୂର୍ବରୁ DeepSeek-R1/V3 ର ନିୟୋଜନ ସମାପ୍ତ କରିବା ପରେ, ଆମେ ହଠାତ୍ ଅନେକ ଜଣାଶୁଣା କ୍ଲାଏଣ୍ଟଙ୍କଠାରୁ ସହଯୋଗ ଅନୁରୋଧ ପାଇଲୁ, ଏବଂ ପୂର୍ବରୁ ନିଷ୍କ୍ରିୟ କ୍ଲାଏଣ୍ଟମାନେ ଆମର DeepSeek ସେବାଗୁଡ଼ିକୁ ପରିଚିତ କରାଇବା ପାଇଁ ଯୋଗାଯୋଗ ଆରମ୍ଭ କରିଥିଲେ।" ବର୍ତ୍ତମାନ, ଏହା ଦେଖାଯାଉଛି ଯେ DeepSeek ମଡେଲ୍ ଅନୁମାନ କାର୍ଯ୍ୟଦକ୍ଷତାକୁ କ୍ରମାଗତ ଭାବରେ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ କରୁଛି, ଏବଂ ବଡ଼ ମଡେଲ୍ଗୁଡ଼ିକର ବ୍ୟାପକ ଗ୍ରହଣ ସହିତ, ଏହା AI ଇନଫ୍ରା ଶିଳ୍ପରେ ବିକାଶକୁ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଭାବରେ ପ୍ରଭାବିତ କରିବ। ଯଦି ଏକ DeepSeek-ସ୍ତରୀୟ ମଡେଲ୍ କମ୍ ମୂଲ୍ୟରେ ସ୍ଥାନୀୟ ଭାବରେ ନିୟୋଜନ କରାଯାଇପାରିବ, ତେବେ ଏହା ସରକାର ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ୍ ଡିଜିଟାଲ୍ ପରିବର୍ତ୍ତନ ପ୍ରୟାସକୁ ବହୁତ ସାହାଯ୍ୟ କରିବ। ତଥାପି, ଚ୍ୟାଲେଞ୍ଜଗୁଡ଼ିକ ଜାରି ରହିଛି, କାରଣ କିଛି କ୍ଲାଏଣ୍ଟ ବଡ଼ ମଡେଲ୍ କ୍ଷମତା ସମ୍ପର୍କରେ ଉଚ୍ଚ ଆଶା ରଖିପାରନ୍ତି, ଯାହା ଏହାକୁ ଅଧିକ ସ୍ପଷ୍ଟ କରିଥାଏ ଯେ କାର୍ଯ୍ୟଦକ୍ଷତା ଏବଂ ମୂଲ୍ୟ ସନ୍ତୁଳନ କରିବା ବ୍ୟବହାରିକ ନିୟୋଜନରେ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହୋଇଯାଏ।
ଡିପସିକ୍ ଚାଟଜିପିଟି ଅପେକ୍ଷା ଭଲ କି ନାହିଁ ତାହା ମୂଲ୍ୟାଙ୍କନ କରିବା ପାଇଁ, ସେମାନଙ୍କର ମୁଖ୍ୟ ପାର୍ଥକ୍ୟ, ଶକ୍ତି ଏବଂ ବ୍ୟବହାର ମାମଲାଗୁଡ଼ିକୁ ବୁଝିବା ଅତ୍ୟନ୍ତ ଜରୁରୀ। ଏଠାରେ ଏକ ବ୍ୟାପକ ତୁଳନା ଦିଆଯାଇଛି:
ବୈଶିଷ୍ଟ୍ୟ/ଦିଶ୍ୟୁ | ଡିପସିକ୍ | ଚାଟ୍ଜିପିଟି |
---|---|---|
ମାଲିକାନା | ଏକ ଚୀନ୍ କମ୍ପାନୀ ଦ୍ୱାରା ବିକଶିତ | OpenAI ଦ୍ୱାରା ବିକଶିତ |
ଉତ୍ସ ମଡେଲ୍ | ମୁକ୍ତ-ଉତ୍ସ | ମାଲିକାନା |
ମୂଲ୍ୟ | ବ୍ୟବହାର କରିବାକୁ ମାଗଣା; ଶସ୍ତା API ପ୍ରବେଶ ବିକଳ୍ପ | ସଦସ୍ୟତା କିମ୍ବା ବ୍ୟବହାର ପାଇଁ ଦେୟ ମୂଲ୍ୟ |
କଷ୍ଟମାଇଜେସନ୍ | ଅତ୍ୟନ୍ତ କଷ୍ଟମାଇଜେବଲ୍, ବ୍ୟବହାରକାରୀମାନଙ୍କୁ ଏଥିରେ ପରିବର୍ତ୍ତନ ଏବଂ ନିର୍ମାଣ କରିବାକୁ ଅନୁମତି ଦେଉଛି | ସୀମିତ କଷ୍ଟମାଇଜେସନ୍ ଉପଲବ୍ଧ |
ନିର୍ଦ୍ଦିଷ୍ଟ କାର୍ଯ୍ୟରେ କାର୍ଯ୍ୟଦକ୍ଷତା | ଡାଟା ଆନାଲିଟିକ୍ସ ଏବଂ ସୂଚନା ପୁନରୁଦ୍ଧାର ଭଳି କିଛି କ୍ଷେତ୍ରରେ ଉତ୍କର୍ଷତା ହାସଲ କରେ। | ସୃଜନଶୀଳ ଲେଖା ଏବଂ କଥାବାର୍ତ୍ତା କାର୍ଯ୍ୟରେ ଦୃଢ଼ ପ୍ରଦର୍ଶନ ସହିତ ବହୁମୁଖୀ |
ଭାଷା ସମର୍ଥନ | ଚୀନ୍ ଭାଷା ଏବଂ ସଂସ୍କୃତି ଉପରେ ଦୃଢ଼ ଧ୍ୟାନ | ବ୍ୟାପକ ଭାଷା ସମର୍ଥନ କିନ୍ତୁ ଆମେରିକା-କେନ୍ଦ୍ରିକ |
ତାଲିମ ମୂଲ୍ୟ | ଦକ୍ଷତା ପାଇଁ ଅନୁକୂଳିତ, ତାଲିମ ଖର୍ଚ୍ଚ କମ | ଅଧିକ ତାଲିମ ଖର୍ଚ୍ଚ, ଯଥେଷ୍ଟ କମ୍ପ୍ୟୁଟେସନଲ୍ ସମ୍ବଳ ଆବଶ୍ୟକ |
ପ୍ରତିକ୍ରିୟାର ପରିବର୍ତ୍ତନ | ଭୂରାଜନୈତିକ ପ୍ରସଙ୍ଗ ଦ୍ୱାରା ପ୍ରଭାବିତ ହୋଇ, ଭିନ୍ନ ପ୍ରତିକ୍ରିୟା ଦେଇପାରେ | ତାଲିମ ତଥ୍ୟ ଉପରେ ଆଧାରିତ ସ୍ଥିର ଉତ୍ତରଗୁଡ଼ିକ |
ଲକ୍ଷ୍ୟ ଦର୍ଶକ | ନମନୀୟତା ଚାହୁଁଥିବା ଡେଭଲପର ଏବଂ ଗବେଷକଙ୍କ ପାଇଁ ଉଦ୍ଦିଷ୍ଟ | କଥାବାର୍ତ୍ତା କ୍ଷମତା ଖୋଜୁଥିବା ସାଧାରଣ ବ୍ୟବହାରକାରୀଙ୍କ ପାଇଁ ଉଦ୍ଦିଷ୍ଟ |
ବ୍ୟବହାର ମାମଲାଗୁଡ଼ିକ | କୋଡ୍ ଜେନେରେସନ୍ ଏବଂ ଶୀଘ୍ର କାର୍ଯ୍ୟ ପାଇଁ ଅଧିକ ଦକ୍ଷ | ଟେକ୍ସଟ୍ ତିଆରି କରିବା, ପ୍ରଶ୍ନର ଉତ୍ତର ଦେବା ଏବଂ ଆଲୋଚନାରେ ସାମିଲ ହେବା ପାଇଁ ଉପଯୁକ୍ତ। |
"Nvidia କୁ ବାଧା ଦେବା" ଉପରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଦୃଷ୍ଟିକୋଣ
ବର୍ତ୍ତମାନ, Huawei ବ୍ୟତୀତ, Moore Threads, Muxi, Biran Technology, ଏବଂ Tianxu Zhixin ଭଳି ଅନେକ ଘରୋଇ ଚିପ୍ ନିର୍ମାତା ମଧ୍ୟ DeepSeek ର ଦୁଇଟି ମଡେଲ ସହିତ ଖାପଖୁଆଇବା ଆରମ୍ଭ କରୁଛନ୍ତି। ଜଣେ ଚିପ୍ ନିର୍ମାତା AI ଟେକ୍ନୋଲୋଜି ରିଭ୍ୟୁକୁ କହିଛନ୍ତି, "DeepSeek ର ଗଠନ ନବସୃଜନ ପ୍ରଦର୍ଶନ କରେ, ତଥାପି ଏହା ଏକ LLM ରହିଛି। DeepSeek ପ୍ରତି ଆମର ଅନୁକୂଳନ ମୁଖ୍ୟତଃ ଯୁକ୍ତିଯୁକ୍ତ ପ୍ରୟୋଗ ଉପରେ କେନ୍ଦ୍ରିତ, ଯାହା ବୈଷୟିକ କାର୍ଯ୍ୟାନ୍ୱୟନକୁ ବହୁତ ସରଳ ଏବଂ ଦ୍ରୁତ କରିଥାଏ।" ତଥାପି, MoE ପଦ୍ଧତି ପାଇଁ ସଂରକ୍ଷଣ ଏବଂ ବଣ୍ଟନ ଦୃଷ୍ଟିରୁ ଅଧିକ ଚାହିଦା ଆବଶ୍ୟକ, ଘରୋଇ ଚିପ୍ସ ସହିତ ନିୟୋଜିତ କରିବା ସମୟରେ ସୁସଙ୍ଗତତା ସୁନିଶ୍ଚିତ କରିବା ସହିତ, ଅନୁକୂଳନ ସମୟରେ ସମାଧାନ ଆବଶ୍ୟକ କରୁଥିବା ଅନେକ ଇଞ୍ଜିନିୟରିଂ ଚ୍ୟାଲେଞ୍ଜ ଉପସ୍ଥାପନ କରେ। "ବର୍ତ୍ତମାନ, ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ୍ ଶକ୍ତି Nvidia ସହିତ ବ୍ୟବହାରଯୋଗ୍ୟତା ଏବଂ ସ୍ଥିରତା ସହିତ ମେଳ ଖାଉନାହିଁ, ସଫ୍ଟୱେର୍ ପରିବେଶ ସେଟଅପ୍, ସମସ୍ୟା ସମାଧାନ ଏବଂ ମୂଳ କାର୍ଯ୍ୟଦକ୍ଷତା ଅପ୍ଟିମାଇଜେସନ୍ ପାଇଁ ମୂଳ କାରଖାନା ଅଂଶଗ୍ରହଣ ଆବଶ୍ୟକ," ବ୍ୟବହାରିକ ଅଭିଜ୍ଞତା ଉପରେ ଆଧାର କରି ଜଣେ ଶିଳ୍ପ ଅଭ୍ୟାସକାରୀ କହିଛନ୍ତି। ଏକାଥରେ, "DeepSeek R1 ର ବଡ଼ ପାରାମିଟର ସ୍କେଲ୍ ଯୋଗୁଁ, ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ୍ ଶକ୍ତି ସମାନ୍ତରାଳୀକରଣ ପାଇଁ ଅଧିକ ନୋଡ୍ ଆବଶ୍ୟକ କରେ। ଅତିରିକ୍ତ ଭାବରେ, ଘରୋଇ ହାର୍ଡୱେୟାର ନିର୍ଦ୍ଦିଷ୍ଟକରଣ ଏବେ ବି କିଛି ପଛରେ ଅଛି; ଉଦାହରଣ ସ୍ୱରୂପ, Huawei 910B ବର୍ତ୍ତମାନ DeepSeek ଦ୍ୱାରା ପ୍ରଚଳିତ FP8 ଅନୁମାନକୁ ସମର୍ଥନ କରିପାରିବ ନାହିଁ।" DeepSeek V3 ମଡେଲର ଏକ ପ୍ରମୁଖ ଦିଗ ହେଉଛି ଏକ FP8 ମିଶ୍ରିତ ସଠିକତା ତାଲିମ ଢାଞ୍ଚାର ପରିଚୟ, ଯାହାକୁ ଏକ ଅତ୍ୟନ୍ତ ବଡ଼ ମଡେଲରେ ପ୍ରଭାବଶାଳୀ ଭାବରେ ବୈଧ କରାଯାଇଛି, ଯାହା ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ସଫଳତା। ପୂର୍ବରୁ, Microsoft ଏବଂ Nvidia ପରି ପ୍ରମୁଖ ଖେଳାଳିମାନେ ସମ୍ବନ୍ଧିତ କାର୍ଯ୍ୟ ପରାମର୍ଶ ଦେଇଥିଲେ, କିନ୍ତୁ ସମ୍ଭାବ୍ୟତା ସମ୍ପର୍କରେ ଶିଳ୍ପ ମଧ୍ୟରେ ସନ୍ଦେହ ରହିଛି। ଏହା ବୁଝାପଡୁଛି ଯେ INT8 ତୁଳନାରେ, FP8 ର ପ୍ରାଥମିକ ସୁବିଧା ହେଉଛି ଯେ ତାଲିମ ପରବର୍ତ୍ତୀ ପରିମାଣୀକରଣ ପ୍ରାୟ କ୍ଷତିହୀନ ସଠିକତା ହାସଲ କରିପାରିବ ଏବଂ ଅନୁମାନ ଗତିକୁ ଉଲ୍ଲେଖନୀୟ ଭାବରେ ବୃଦ୍ଧି କରିପାରିବ। FP16 ସହିତ ତୁଳନା କରିବା ସମୟରେ, FP8 Nvidia ର H20 ରେ ଦୁଇ ଗୁଣ ଏବଂ H100 ରେ 1.5 ଗୁଣରୁ ଅଧିକ ତ୍ୱରାନ୍ୱିତ ଅନୁଭବ କରିପାରିବ। ଉଲ୍ଲେଖନୀୟ ଯେ, ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ୍ ପାୱାର ଏବଂ ଘରୋଇ ମଡେଲର ଧାରା ବିଷୟରେ ଆଲୋଚନା ଗତିଶୀଳ ହେବା ସହିତ, Nvidia କୁ ବାଧାପ୍ରାପ୍ତ କରାଯାଇପାରିବ କି ନାହିଁ ଏବଂ CUDA ଖାତକୁ ବାଇପାସ୍ କରାଯାଇପାରିବ କି ନାହିଁ ସେ ବିଷୟରେ ଅନୁମାନ କ୍ରମଶଃ ପ୍ରଚଳିତ ହେଉଛି। ଏକ ଅସ୍ୱୀକାର୍ଯ୍ୟ ସତ୍ୟ ହେଉଛି ଯେ DeepSeek ପ୍ରକୃତରେ Nvidia ର ବଜାର ମୂଲ୍ୟରେ ଏକ ଯଥେଷ୍ଟ ହ୍ରାସ ଘଟାଇଛି, କିନ୍ତୁ ଏହି ପରିବର୍ତ୍ତନ Nvidia ର ଉଚ୍ଚ-ସ୍ତରର କମ୍ପ୍ୟୁଟେସନାଲ୍ ପାୱାର ଅଖଣ୍ଡତା ବିଷୟରେ ପ୍ରଶ୍ନ ଉଠାଇଛି। ପୁଞ୍ଜି-ଚାଳିତ କମ୍ପ୍ୟୁଟେସନାଲ୍ ସଂଗ୍ରହ ସମ୍ପର୍କରେ ପୂର୍ବରୁ ଗୃହୀତ ବର୍ଣ୍ଣନାଗୁଡ଼ିକୁ ଚ୍ୟାଲେଞ୍ଜ କରାଯାଉଛି, ତଥାପି ତାଲିମ ପରିସ୍ଥିତିରେ Nvidia କୁ ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ ପ୍ରତିସ୍ଥାପିତ କରିବା କଷ୍ଟକର ରହିଛି। DeepSeek ର CUDA ର ଗଭୀର ବ୍ୟବହାରର ବିଶ୍ଳେଷଣ ଦର୍ଶାଏ ଯେ ନମନୀୟତା - ଯେପରିକି ଯୋଗାଯୋଗ ପାଇଁ SM ବ୍ୟବହାର କରିବା କିମ୍ବା ନେଟୱାର୍କ କାର୍ଡଗୁଡ଼ିକୁ ସିଧାସଳଖ ପରିଚାଳନା କରିବା - ନିୟମିତ GPU ପାଇଁ ସମ୍ଭାବ୍ୟ ନୁହେଁ। ଶିଳ୍ପ ଦୃଷ୍ଟିକୋଣ ଗୁରୁତ୍ୱାରୋପ କରେ ଯେ Nvidia ର ଖାତ କେବଳ CUDA ନୁହେଁ ବରଂ ସମଗ୍ର CUDA ଇକୋସିଷ୍ଟମକୁ ଘେରି ରହିଛି, ଏବଂ DeepSeek ନିଯୁକ୍ତ କରୁଥିବା PTX (ସମାନ୍ତରାଳ ଥ୍ରେଡ୍ କାର୍ଯ୍ୟନ୍ୱୟନ) ନିର୍ଦ୍ଦେଶାବଳୀ ଏବେ ବି CUDA ଇକୋସିଷ୍ଟମର ଅଂଶ। "ସଂକ୍ଷିପ୍ତ ଅବଧିରେ, Nvidia ର କମ୍ପ୍ୟୁଟେସନାଲ୍ ଶକ୍ତିକୁ ବାଇପାସ୍ କରାଯାଇପାରିବ ନାହିଁ - ଏହା ତାଲିମରେ ବିଶେଷ ଭାବରେ ସ୍ପଷ୍ଟ; ତଥାପି, ଯୁକ୍ତି ପାଇଁ ଘରୋଇ କାର୍ଡଗୁଡ଼ିକୁ ନିୟୋଜିତ କରିବା ତୁଳନାତ୍ମକ ଭାବରେ ସହଜ ହେବ, ତେଣୁ ଅଗ୍ରଗତି ସମ୍ଭବତଃ ଦ୍ରୁତ ହେବ। ଘରୋଇ କାର୍ଡଗୁଡ଼ିକର ଅନୁକୂଳନ ମୁଖ୍ୟତଃ ଅନୁମାନ ଉପରେ ଧ୍ୟାନ ଦିଏ; କେହି ଏପର୍ଯ୍ୟନ୍ତ ସ୍କେଲରେ ଘରୋଇ କାର୍ଡ ଉପରେ DeepSeek ର କାର୍ଯ୍ୟଦକ୍ଷତାର ଏକ ମଡେଲକୁ ତାଲିମ ଦେବାରେ ସଫଳ ହୋଇନାହାଁନ୍ତି," ଜଣେ ଶିଳ୍ପ ବିଶ୍ଳେଷକ AI ଟେକ୍ନୋଲୋଜି ସମୀକ୍ଷାକୁ ମନ୍ତବ୍ୟ ଦେଇଛନ୍ତି। ସାମଗ୍ରିକ ଭାବରେ, ଅନୁମାନ ଦୃଷ୍ଟିକୋଣରୁ, ପରିସ୍ଥିତି ଘରୋଇ ବଡ଼ ମଡେଲ ଚିପ୍ସ ପାଇଁ ଉତ୍ସାହଜନକ। ପ୍ରଶିକ୍ଷଣର ଅତ୍ୟଧିକ ଉଚ୍ଚ ଆବଶ୍ୟକତା ଯୋଗୁଁ ଅନୁମାନ କ୍ଷେତ୍ରରେ ଘରୋଇ ଚିପ୍ ନିର୍ମାତାମାନଙ୍କ ପାଇଁ ସୁଯୋଗ ଅଧିକ ସ୍ପଷ୍ଟ, ଯାହା ପ୍ରବେଶକୁ ବାଧା ଦିଏ। ବିଶ୍ଳେଷକମାନେ ମତ ଦିଅନ୍ତି ଯେ କେବଳ ଘରୋଇ ଅନୁମାନ କାର୍ଡ ବ୍ୟବହାର କରିବା ଯଥେଷ୍ଟ; ଯଦି ଆବଶ୍ୟକ ହୁଏ, ତେବେ ଏକ ଅତିରିକ୍ତ ମେସିନ୍ ହାସଲ କରିବା ସମ୍ଭବପର, ଯେତେବେଳେ ତାଲିମ ମଡେଲ୍ ଅନନ୍ୟ ଚ୍ୟାଲେଞ୍ଜ ସୃଷ୍ଟି କରେ - ବର୍ଦ୍ଧିତ ସଂଖ୍ୟକ ମେସିନ୍ ପରିଚାଳନା କରିବା ଭାରୀ ହୋଇପାରେ, ଏବଂ ଉଚ୍ଚ ତ୍ରୁଟି ହାର ତାଲିମ ଫଳାଫଳକୁ ନକାରାତ୍ମକ ଭାବରେ ପ୍ରଭାବିତ କରିପାରେ। ତାଲିମର ମଧ୍ୟ ନିର୍ଦ୍ଦିଷ୍ଟ କ୍ଲଷ୍ଟର ସ୍କେଲ୍ ଆବଶ୍ୟକତା ଅଛି, ଯେତେବେଳେ ଅନୁମାନ ପାଇଁ କ୍ଲଷ୍ଟରଗୁଡ଼ିକର ଚାହିଦା ଏତେ କଠୋର ନୁହେଁ, ତେଣୁ GPU ଆବଶ୍ୟକତାକୁ ସହଜ କରିଥାଏ। ବର୍ତ୍ତମାନ, Nvidia ର ଏକକ H20 କାର୍ଡର କାର୍ଯ୍ୟଦକ୍ଷତା Huawei କିମ୍ବା Cambrian କୁ ଅତିକ୍ରମ କରେ ନାହିଁ; ଏହାର ଶକ୍ତି କ୍ଲଷ୍ଟରିଂରେ ରହିଛି। କମ୍ପ୍ୟୁଟେସନାଲ୍ ପାୱାର ବଜାର ଉପରେ ସାମଗ୍ରିକ ପ୍ରଭାବ ଉପରେ ଆଧାର କରି, ଲୁଚେନ୍ ଟେକ୍ନୋଲୋଜିର ପ୍ରତିଷ୍ଠାତା, ୟୁ ୟାଙ୍ଗ୍, AI ଟେକ୍ନୋଲୋଜି ରିଭ୍ୟୁ ସହିତ ଏକ ସାକ୍ଷାତକାରରେ ଉଲ୍ଲେଖ କରିଛନ୍ତି, "DeepSeek ଅସ୍ଥାୟୀ ଭାବରେ ଅଲ୍ଟ୍ରା-ଲାର୍ଜ ତାଲିମ କମ୍ପ୍ୟୁଟେସନାଲ୍ କ୍ଲଷ୍ଟରଗୁଡ଼ିକର ପ୍ରତିଷ୍ଠା ଏବଂ ଭଡାକୁ ଦୁର୍ବଳ କରିପାରେ। ଦୀର୍ଘକାଳୀନ ଭାବରେ, ବଡ଼ ମଡେଲ୍ ତାଲିମ, ଯୁକ୍ତି ଏବଂ ପ୍ରୟୋଗ ସହିତ ଜଡିତ ଖର୍ଚ୍ଚକୁ ଉଲ୍ଲେଖନୀୟ ଭାବରେ ହ୍ରାସ କରି, ବଜାର ଚାହିଦା ବୃଦ୍ଧି ପାଇବାର ସମ୍ଭାବନା ଅଛି। ଏହା ଉପରେ ଆଧାରିତ AI ର ପରବର୍ତ୍ତୀ ପୁନରାବୃତ୍ତି ତେଣୁ ଗଣନା ଶକ୍ତି ବଜାରରେ ନିରନ୍ତର ଚାହିଦାକୁ କ୍ରମାଗତ ଭାବରେ ଚଳାଇବ।" ଏହା ସହିତ, "ଡିପସିକର ଯୁକ୍ତି ଏବଂ ଫାଇନ-ଟ୍ୟୁନିଂ ସେବା ପାଇଁ ବର୍ଦ୍ଧିତ ଚାହିଦା ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ ଲ୍ୟାଣ୍ଡସ୍କେପ୍ ସହିତ ଅଧିକ ସୁସଙ୍ଗତ, ଯେଉଁଠାରେ ସ୍ଥାନୀୟ କ୍ଷମତା ତୁଳନାତ୍ମକ ଭାବରେ ଦୁର୍ବଳ, କ୍ଲଷ୍ଟର ପ୍ରତିଷ୍ଠା ପରେ ନିଷ୍କ୍ରିୟ ସମ୍ବଳରୁ ଅପଚୟ ହ୍ରାସ କରିବାରେ ସାହାଯ୍ୟ କରେ; ଏହା ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ ଇକୋସିଷ୍ଟମର ବିଭିନ୍ନ ସ୍ତରରେ ନିର୍ମାତାମାନଙ୍କ ପାଇଁ ସମ୍ଭବ ସୁଯୋଗ ସୃଷ୍ଟି କରେ।" ଲୁଚେନ ଟେକ୍ନୋଲୋଜି ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ ଶକ୍ତି ଉପରେ ଆଧାରିତ ଡିପସିକ R1 ସିରିଜ୍ ଯୁକ୍ତି API ଏବଂ କ୍ଲାଉଡ୍ ଇମେଜିଂ ସେବା ଲଞ୍ଚ କରିବା ପାଇଁ Huawei କ୍ଲାଉଡ୍ ସହିତ ସହଯୋଗ କରିଛି। ୟୁ ୟାଙ୍ଗ ଭବିଷ୍ୟତ ବିଷୟରେ ଆଶାବାଦ ପ୍ରକାଶ କରିଛନ୍ତି: "ଡିପସିକ ଘରୋଇ ଭାବରେ ଉତ୍ପାଦିତ ସମାଧାନରେ ବିଶ୍ୱାସ ସୃଷ୍ଟି କରେ, ଆଗକୁ ଘରୋଇ କମ୍ପ୍ୟୁଟେସନାଲ କ୍ଷମତାରେ ଅଧିକ ଉତ୍ସାହ ଏବଂ ନିବେଶକୁ ଉତ୍ସାହିତ କରେ।"

ଉପସଂହାର
DeepSeek ChatGPT ଅପେକ୍ଷା "ଉତ୍ତମ" କି ନାହିଁ ତାହା ଉପଭୋକ୍ତାଙ୍କ ନିର୍ଦ୍ଦିଷ୍ଟ ଆବଶ୍ୟକତା ଏବଂ ଉଦ୍ଦେଶ୍ୟ ଉପରେ ନିର୍ଭର କରେ। ନମନୀୟତା, କମ ମୂଲ୍ୟ ଏବଂ କଷ୍ଟମାଇଜେସନ ଆବଶ୍ୟକ କରୁଥିବା କାର୍ଯ୍ୟ ପାଇଁ, DeepSeek ଉତ୍କୃଷ୍ଟ ହୋଇପାରେ। ସୃଜନଶୀଳ ଲେଖା, ସାଧାରଣ ଅନୁସନ୍ଧାନ ଏବଂ ଉପଭୋକ୍ତା-ଅନୁକୂଳ ବାର୍ତ୍ତାଳାପ ଇଣ୍ଟରଫେସ୍ ପାଇଁ, ChatGPT ନେତୃତ୍ୱ ନେଇପାରେ। ପ୍ରତ୍ୟେକ ଉପକରଣ ଭିନ୍ନ ଭିନ୍ନ ଉଦ୍ଦେଶ୍ୟ ସାଧନ କରେ, ତେଣୁ ପସନ୍ଦ ସେଗୁଡ଼ିକ କେଉଁ ପ୍ରସଙ୍ଗରେ ବ୍ୟବହୃତ ହେଉଛି ତାହା ଉପରେ ବହୁ ପରିମାଣରେ ନିର୍ଭର କରିବ।
ନିୟନ୍ତ୍ରଣ କେବୁଲ୍ଗୁଡ଼ିକ
ସଂରଚିତ କେବଲିଂ ସିଷ୍ଟମ
ନେଟୱାର୍କ ଏବଂ ଡାଟା, ଫାଇବର-ଅପ୍ଟିକ୍ କେବୁଲ୍, ପ୍ୟାଚ୍ କର୍ଡ, ମଡ୍ୟୁଲ୍, ଫେସପ୍ଲେଟ୍
ଏପ୍ରିଲ୍ ୧୬-୧୮, ୨୦୨୪ ଦୁବାଇରେ ମଧ୍ୟ-ପୂର୍ବ-ଶକ୍ତି
୧୬ ଏପ୍ରିଲ୍-୧୮ ଏପ୍ରିଲ୍, ୨୦୨୪ ମସ୍କୋରେ ସେକ୍ୟୁରିକା
୯ ମଇ, ୨୦୨୪ରେ ସାଂଘାଇରେ ନୂତନ ଉତ୍ପାଦ ଏବଂ ପ୍ରଯୁକ୍ତିବିଦ୍ୟାର ଶୁଭାରମ୍ଭ କାର୍ଯ୍ୟକ୍ରମ
୨୨ ଅକ୍ଟୋବର-୨୫ ତାରିଖ, ୨୦୨୪ ବେଜିଂରେ ସୁରକ୍ଷା ଚୀନ୍
ନଭେମ୍ବର ୧୯-୨୦, ୨୦୨୪ ସଂଯୁକ୍ତ ବିଶ୍ୱ KSA
ପୋଷ୍ଟ ସମୟ: ଫେବୃଆରୀ-୧୦-୨୦୨୫