๐Ÿ”…Azure Data Lake Storage

Azure Data Lake Storage (ADLS), bรผyรผk miktarda veriyi depolamak ve bu veriler รผzerinde analiz yapmak iรงin kullanฤฑlan bir Microsoft Azure depolama hizmetidir.

Azure Blob Storage vs Azure Data Lake Storage (ADLS)

Azure Blob Storage

  • Metin olmayan yapฤฑlandฤฑrฤฑlmamฤฑลŸ veri depolamak iรงin idealdir (รถrneฤŸin, fotoฤŸraflar, videolar vb.).

  • ฤฐhtiyaรงlarฤฑnฤฑza gรถre replikasyon seรงebilirsiniz; varsayฤฑlan seรงim Genel Olarak Kullanฤฑlabilir Depolama (GRS) olacaktฤฑr.

  • Dรผz (flat) ad alanlarฤฑna sahiptir.

  • Hadoop ile uyumlu deฤŸildir.

  • Ayrฤฑntฤฑlฤฑ (granรผler) eriลŸim mevcut deฤŸildir.

Azure Data Lake Storage (ADLS)

  • Bรผyรผk miktarda metin verisi depolamak iรงin idealdir.

  • Varsayฤฑlan olarak sunulmadฤฑฤŸฤฑ iรงin replikasyonu ayarlamanฤฑz gerekir.

  • HiyerarลŸik ad alanlarฤฑna sahiptir.

  • Hadoop verilerini saklayabilir.

  • Ayrฤฑntฤฑlฤฑ (granรผler) eriลŸim saฤŸlanabilir.

Genel olarak, Azure Blob Storage daha รงok genel amaรงlฤฑ veri depolama iรงin kullanฤฑlฤฑrken, ADLS รถzellikle bรผyรผk veri analizi ve Hadoop ekosistemine yรถnelik ihtiyaรงlar iรงin tasarlanmฤฑลŸtฤฑr ve daha karmaลŸฤฑk veri yรถnetimi senaryolarฤฑnฤฑ destekler. ADLS'nin hiyerarลŸik ad alanฤฑ yapฤฑsฤฑ, veri dosyalarฤฑnฤฑ bir dosya sistemi gibi organize etmeyi saฤŸlar ve Hadoop uyumluluฤŸu bรผyรผk veri iลŸleme ve analizleri iรงin รถnemlidir. Granรผler eriลŸim kontrolรผ, verilere daha ayrฤฑntฤฑlฤฑ eriลŸim saฤŸlamak ve gรผvenlik, yรถnetim iรงin daha fazla kontrol sunmak anlamฤฑna gelir.

Adฤฑm Adฤฑm ร–rnek:

1. Veri Yรผklemesi

Bir ลŸirketin, sosyal medya yorumlarฤฑndan elde ettiฤŸi bรผyรผk bir metin veri seti olsun. Bu verileri, ADLS'ye yรผkler. Yรผkleme iลŸlemi, Azure portalฤฑ, Azure CLI (komut satฤฑrฤฑ arayรผzรผ) veya SDK'lar aracฤฑlฤฑฤŸฤฑyla yapฤฑlabilir.

2. Veri Depolama ve Organizasyon

ADLS'de veriler, dosya sistemi benzeri bir hiyerarลŸi iรงinde saklanฤฑr. Yani, verileri klasรถrler ve alt klasรถrler ลŸeklinde organize edebilirsiniz. ร–rneฤŸin, ลŸirket verileri ลŸu ลŸekilde dรผzenleyebilir:

/social-media-data/2024/
    /twitter/
        /data-part1.json
        /data-part2.json
    /facebook/
        /data-part1.json
        /data-part2.json

Bu yapฤฑ, verilere hฤฑzlฤฑ ve kolay eriลŸim saฤŸlar ve yรถnetimini kolaylaลŸtฤฑrฤฑr.

3. Veri EriลŸimi ve Analizi

Veri bilimcileri, yรผklenen veriler รผzerinde analiz yapmak isterlerse, ADLS รผzerinde doฤŸrudan bรผyรผk veri analizi araรงlarฤฑ รงalฤฑลŸtฤฑrabilirler. ร–rneฤŸin, Apache Spark veya Hadoop gibi araรงlar kullanฤฑlarak ADLS'de saklanan veri setlerinden iรงgรถrรผler elde edilebilir.

4. Gรผvenlik ve ฤฐzin Yรถnetimi

ADLS, granรผler eriลŸim kontrolรผ sunar. ลžirket, belirli klasรถrler veya dosyalar iรงin farklฤฑ eriลŸim dรผzeylerini belirleyebilir. ร–rneฤŸin, sadece bazฤฑ veri bilimcilerinin 'twitter' klasรถrรผne eriลŸmesine izin verilebilir.

5. ร–lรงeklendirme ve Maliyet Yรถnetimi

Veri seti bรผyรผdรผkรงe, ADLS otomatik olarak รถlรงeklenir. ลžirket, kullanฤฑlan depolama alanฤฑna gรถre รถdeme yapar, bรถylece gereksiz maliyetlerden kaรงฤฑnฤฑr.

Last updated