PDF থেকে Excel কনভার্সন কীভাবে কাজ করে
PDF শেয়ার করার জন্য দারুণ, কিন্তু স্প্রেডশিটের জন্য বানানো নয়। এই টুল প্রতিটি PDF পেজ থেকে সিলেক্ট করা যায় এমন টেক্সট পড়ে এবং সেটাকে রো এবং কলাম হিসেবে সাজানোর চেষ্টা করে, তারপর আপনার ব্রাউজারেই সরাসরি একটি Excel (.xlsx) ফাইল এক্সপোর্ট করে।
কখন এই টুল ব্যবহার করবেন
PDF-এর ভিতরের ডেটা যখন sort, filter, total, বা reuse করতে হবে — বিশেষ করে ইনভয়েস, রিপোর্ট, স্টেটমেন্ট, শিডিউল, বা অন্য সিস্টেমের এক্সপোর্টের টেবিল — তখন PDF থেকে Excel ব্যবহার করুন।
- ইনভয়েস & রিসিট: লাইন আইটেম রোতে এনে মোট করুন ও ক্যাটাগরি দিন।
- রিপোর্ট: টেবিল Excel-এ এনে চার্ট, পিভট ও তুলনা করুন।
- লিস্ট & লগ: PDF এক্সপোর্টকে শিটে এনে ক্লিন করে একত্র করুন।
“উল্টো” দিক (শিট → PDF) দরকার হলে Excel থেকে PDF কনভার্টার ব্যবহার করুন। যদি সেল নয়, editable টেক্সট দরকার হয়, তাহলে PDF থেকে Word বা PDF থেকে টেক্সট চেষ্টা করুন।
ধাপে ধাপে: PDF থেকে Excel
আপনার PDF কনভার্ট করা খুবই সহজ:
- PDF ফাইল যোগ করুন। উপরের বক্সে ড্র্যাগ & ড্রপ করুন, বা ব্রাউজ করতে ক্লিক করুন।
- তালিকা দেখে নিন। প্রতিটি PDF-এর স্ট্যাটাস দেখাবে কী প্রসেস হবে।
- Excel-এ কনভার্ট করুন। Excel-এ কনভার্ট করুন চাপুন। প্রতিটি PDF একটি .xlsx ফাইল হবে।
- ফাইল সেভ করুন। এক এক করে সেভ করুন, বা সব প্রস্তুত হলে সব স্প্রেডশিট সেভ করুন ব্যবহার করুন।
প্রাইভেসি, সীমা এবং ফাইল কীভাবে ব্যবহৃত হয়
FileYoga একটি সহজ নিয়ম মেনে চলে: আপনার ফাইল আপনার কাছেই থাকে। PDF থেকে Excel কনভার্সন আপনার ব্রাউজারেই লোকালি চলে, তাই আপনার PDF কখনও FileYoga সার্ভারে আপলোড হয় না।
শুধু লোকাল কনভার্সন
কনভার্সন আপনার ডিভাইসের ব্রাউজারেই চলে। PDF আপলোড হয় না, এবং XLSX আউটপুটও আপনার দিকেই তৈরি হয়।
কোনো লুকানো কপি নেই
আপনি তালিকা পরিষ্কার করলে বা ট্যাব বন্ধ করলে টুল আপনার ফাইল ব্যবহার বন্ধ করে, এবং সার্ভারে কোনো কপি জমা রাখে না।
কৃত্রিম সীমা নেই
কোনো paywall বা quota নেই। সীমা নির্ভর করে আপনার ডিভাইসের মেমরি ও ব্রাউজারের উপর।
অ্যাকাউন্ট লাগে না
সাইন আপ ছাড়াই ব্যবহার করুন। পেজ খুলুন, PDF কনভার্ট করুন, কাজ শেষ হলে বের হয়ে যান।
আপনি যদি সংবেদনশীল ডেটা (ইনভয়েস, ফাইন্যান্সিয়াল স্টেটমেন্ট, ইন্টার্নাল এক্সপোর্ট) নিয়ে কাজ করেন, লোকাল প্রসেসিং পুরো ওয়ার্কফ্লোকে প্রাইভেট রাখে।
ভালো ফল পেতে টিপস
- সেরা ফল আসে ডিজিটাল PDF থেকে (Excel/রিপোর্টিং টুল থেকে এক্সপোর্ট করা, সিলেক্টেবল টেক্সট থাকে)।
- যদি PDF স্ক্যান/ছবি হয়, এই টুল OCR করে “পড়ে” না — ফল খালি বা এলোমেলো হতে পারে।
- কনভার্টের পর সাধারণত সামান্য ক্লিনআপ লাগে: split cell ঠিক করা, হেডার নাম ঠিক করা, ফাঁকা রো মুছে ফেলা।
- কলাম এলোমেলো হলে একবারে একটি PDF কনভার্ট করে দেখুন (বড় PDF ব্রাউজারের মেমরিতে চাপ দেয়)।
- মাল্টি-পেজ PDF হলে প্রতি পেজে একটি শিট পাবেন, রিভিউ করা সহজ হয়।
সমস্যা সমাধান
- XLSX খালি বা প্রায় খালি: PDF স্ক্যান (ইমেজ) হতে পারে বা নন-সিলেক্টেবল টেক্সট থাকতে পারে। টেক্সট আছে কিনা দেখতে PDF থেকে টেক্সট চেষ্টা করুন।
- কলাম সরে গেছে / টেবিল “ভেঙে” গেছে: অনেক PDF-এ আসল টেবিল স্ট্রাকচার থাকে না। সোর্স এক্সপোর্ট সহজ করুন, বা এক পেজ করে কনভার্ট করে Excel-এ ক্লিনআপ করুন।
- মার্জড সেল / মাল্টি-লাইন হেডার ঠিকমতো আসছে না: ইনভয়েস/রিপোর্টে সাধারণ। এক্সপোর্টের পর unmerge করে হেডার নতুন করে সাজান।
- নাম্বার টেক্সট হিসেবে এসেছে (কমা/ডেসিমাল/কারেন্সি): লোকেল ফরম্যাটিং কারণে হতে পারে। Excel-এর Convert to Number বা Text-to-Columns ব্যবহার করুন, তারপর নাম্বার ফরম্যাট দিন।
- ব্রাউজার স্লো/ফ্রিজ: বড় PDF বা অনেক ফাইল একসাথে মেমরি লিমিটে যেতে পারে। কম ফাইল দিন, ভারী ট্যাব বন্ধ করুন, বা PDF ছোট অংশে ভাগ করে নিন।
- পাসওয়ার্ড-প্রোটেক্টেড/এনক্রিপ্টেড PDF কনভার্ট হচ্ছে না: ব্রাউজার টুল এনক্রিপ্টেড PDF পড়তে নাও পারে। আগে আনলক করুন (বা আনপ্রোটেক্টেড কপি এক্সপোর্ট করুন), তারপর কনভার্ট করুন।
- PDF নষ্ট/ওপেন হয় না: আগে PDF রিপেয়ার দিয়ে ঠিক করুন, তারপর কনভার্ট করুন।
প্রায়শই জিজ্ঞাসিত প্রশ্ন
অনেক PDF টেবিলকে সত্যিকারের সেল হিসেবে না রেখে শুধু “পজিশনড টেক্সট” হিসেবে রাখে। কনভার্টার টেক্সটের অবস্থান দেখে কলাম অনুমান করে, তাই টাইট স্পেসিং, মাল্টি-লাইন সেল বা মিক্সড অ্যালাইনমেন্টে কলাম সরে যেতে পারে। একবারে একটি ফাইল কনভার্ট করে Excel-এ কলাম ক্লিনআপ করুন।
টেবিল দুটি যদি খুব কাছাকাছি থাকে বা একই অ্যালাইন করা টেক্সট ব্লক শেয়ার করে, তাহলে একটানা গ্রিড হিসেবে একসাথে এক্সপোর্ট হতে পারে। ভিজ্যুয়ালি পরিষ্কার ফাঁক থাকলে আলাদা থাকার সম্ভাবনা বেশি। এক্সপোর্টের পর Excel-এ আলাদা রেঞ্জে ভাগ করতে পারবেন।
অনেক PDF-এ wrapped টেক্সট আলাদা লাইনে সংরক্ষিত থাকে। কনভার্সনের সময় সেগুলো আলাদা রো হয়ে যেতে পারে। Excel-এ প্রয়োজন হলে রো একত্র করুন, অথবা সেল মার্জ করে বর্ণনা কলাম নতুন করে সাজান।
হেডার/ফুটার অনেক সময় পেজের সাধারণ টেক্সট হিসেবেই থাকে, তাই এক্সপোর্টে চলে আসতে পারে। যদি বারবার রিপিট হওয়া টাইটেল, তারিখ, বা পেজ নাম্বার দেখেন, কনভার্টের পর Excel-এ সেই রো গুলো মুছে দিন।
PDF প্রায়ই ভ্যালুকে টেক্সট স্ট্রিং হিসেবে রাখে, আর লোকেল ফরম্যাটিং (কমা/ডেসিমাল/কারেন্সি সিম্বল) নাম্বার অটো-ডিটেকশনে বাধা দিতে পারে। Excel-এর Convert to Number, Text-to-Columns ব্যবহার করুন, বা ইমপোর্টের পর নাম্বার ফরম্যাট পরিবর্তন করুন।
সরাসরি নয়। এই টুল OCR করে না, তাই স্ক্যান/ফটো PDF-এ সাধারণত সিলেক্টেবল টেক্সট থাকে না। সেরা ফল পেতে টেক্সট-ভিত্তিক PDF ব্যবহার করুন (রিপোর্টিং টুল বা স্প্রেডশিট থেকে এক্সপোর্ট করা)।
আগে স্ট্রাকচার, পরে ফরম্যাটিং। কনভার্টার মূলত টেক্সটকে গ্রিডে বসাতে ফোকাস করে। বর্ডার, মার্জড সেল, স্টাইলিং—এসব PDF-এর মতো নাও মিলতে পারে এবং Excel-এ ক্লিনআপ লাগতে পারে।
প্রতিটি PDF একটি XLSX ফাইলে এক্সপোর্ট হয়, আর সেখানে প্রতি পেজে একটি শিট থাকে (Page 1, Page 2, ইত্যাদি)। এতে রিভিউ সহজ হয় এবং লেআউট কনফ্লিক্ট কমে।
এনক্রিপ্টেড বা রেস্ট্রিক্টেড PDF ব্রাউজারে কনভার্ট নাও হতে পারে। আগে PDF আনলক করুন (বা আনপ্রোটেক্টেড কপি এক্সপোর্ট করুন), তারপর Excel-এ কনভার্ট করুন।
কোনো কৃত্রিম সীমা নেই। বাস্তব সীমা আসে আপনার ডিভাইসের মেমরি এবং ব্রাউজারের পারফরম্যান্স থেকে। ট্যাব স্লো হলে একবারে কম ফাইল কনভার্ট করুন বা ছোট PDF ব্যবহার করুন।